The invention provides a social network node mining method based on greedy subgraph. Firstly, based on the node degree of this important attributes based on aggregation coefficient of local topological structure to estimate the potential node influence, according to the impact of potential rank and join the seed node and the candidate set, through the overall evaluation of the sorting of network and choose the node specific threshold highest seed nodes join the candidate set. At the completion of a set of candidate selection, through the linear threshold model improved performance for the spread of corruption influence core strategy for the graph nodes in the set of real simulation, selection of incremental impact range of maximum node is added to the final node mining result set, and dynamic correction candidate at each step is completed the propagation in the collection node repeat, the candidate set modification process and simulate the transmission process until it reaches the expected size of the set of nodes mining results, finally obtained the ideal node mining effect.
【技術實現步驟摘要】
基于貪心子圖的社會網絡節點挖掘方法
本專利技術涉及的是一種社會網絡節點挖掘方法。
技術介紹
社會網絡中的節點挖掘方法主要分為啟發類方法和貪心類方法。前者主要是根據社會網絡節點自身屬性或者網絡自身拓撲結構來衡量網絡中各個節點的重要程度,如度中心性算法,由于其計算節點的重要性時僅考慮節點的鄰居拓撲結構,雖然其計算速度快,但是精確度欠佳;又如接近中心性算法和中介中心性算法,由于其計算時涉及到整個網絡拓撲,所以其算法效率很低。而后者則是通過傳播模型對于每一個節點進行傳播模擬,進而通過其傳播范圍的大小來計算節點的重要程度,該類算法由于結合了傳播模型進行真實傳播,算法效率低下,導致了其不適用于大型社會網絡。
技術實現思路
本專利技術的目的在于提供一種能夠解決現有的社會網絡影響力節點挖掘方法中啟發類方法在節點挖掘效果上不理想及貪心類方法在算法復雜度上極高這兩個問題的基于貪心子圖的社會網絡節點挖掘方法。本專利技術的目的是這樣實現的:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出個影響潛力最大的節點添加到候選集合C1中;步驟二:根據僵尸節點的定義,抽取社會網絡圖中符合條件的節點組成集合,并按照“僵尸節點”的本身特異性閾值從高到低排序,從排名中選取前個節點加入到候選集合C2中;步驟三:對于從候選集合C1中和候選集合C2中共抽取k個節點組成的集合C3,通過改進影響力的線性閾值模型表現為爬山貪婪算法進行傳播激活嘗試,初始時節點挖掘結果集S為空集,此時對集合C3中的每個節點進行傳播模擬,選取激活范圍最大的節點加入集 ...
【技術保護點】
一種基于貪心子圖的社會網絡節點挖掘方法,其特征是:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出
【技術特征摘要】
1.一種基于貪心子圖的社會網絡節點挖掘方法,其特征是:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出個影響潛力最大的節點添加到候選集合C1中;步驟二:根據僵尸節點的定義,抽取社會網絡圖中符合條件的節點組成集合,并按照“僵尸節點”的本身特異性閾值從高到低排序,從排名中選取前個節點加入到候選集合C2中;步驟三:對于從候選集合C1中和候選集合C2中共抽取k個節點組成的集合C3,通過改進影響力的線性閾值模型表現為爬山貪婪算法進行傳播激活嘗試,初始時節點挖掘結果集S為空集,此時對集合C3中的每個節點進行傳播模擬,選取激活范圍最大的節點加入集合S中,完成第一個節點的選擇,同時對每一個被激活的節點進行標記,下一次傳播時默認為已激活節點不進行計算,每一次計算之后,剔除該社會網絡圖中被激活節點,抽取子圖進行下一次傳播;步驟四:通過步驟三的傳播后對集合C3以被標記為傳播過程中的已激活節點的節點進行剔除,此時C3中節點個數變少,重復步驟1和步驟2的節點選取過程,再次選取k個節點填充集合C3;步驟五:重復步驟三的激活傳播過程,直至節點挖掘結果集S達到規模k,結束。2.根據權利要求1所述的基于貪心子圖的社會網絡節點挖掘方法,其特征是節點的影響潛力的估計公式為:
【專利技術屬性】
技術研發人員:王紅濱,印桂生,王念濱,周連科,張載熙,馮夢園,侯莎,張玉鵬,劉紅麗,蘭方合,
申請(專利權)人:哈爾濱工程大學,
類型:發明
國別省市:黑龍江,23
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。