• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于貪心子圖的社會網絡節點挖掘方法技術

    技術編號:15691874 閱讀:112 留言:0更新日期:2017-06-24 05:26
    本發明專利技術提供的是一種基于貪心子圖的社會網絡節點挖掘方法。首先依據節點度這個重要屬性結合了局部拓撲結構的聚集系數估計出節點的影響潛力,根據影響潛力高低排序并加入種子節點候選集合,同時通過對網絡的整體評判排序并選擇出特異性閾值最高的節點加入種子節點候選集合。在完成候選集合的選擇后,通過改進影響力的線性閾值模型表現為貪心子圖策略對于集合中的節點進行真實的傳播模擬,選取增量影響范圍最大的節點加入到最終節點挖掘結果集合中,并且在每一步傳播完成時動態的修正候選集合中的節點,重復候選集合修正過程和傳播模擬過程直至達到預期規模的節點挖掘結果集合,最終得到理想的節點挖掘效果。

    A method of social network node mining based on greedy subgraph

    The invention provides a social network node mining method based on greedy subgraph. Firstly, based on the node degree of this important attributes based on aggregation coefficient of local topological structure to estimate the potential node influence, according to the impact of potential rank and join the seed node and the candidate set, through the overall evaluation of the sorting of network and choose the node specific threshold highest seed nodes join the candidate set. At the completion of a set of candidate selection, through the linear threshold model improved performance for the spread of corruption influence core strategy for the graph nodes in the set of real simulation, selection of incremental impact range of maximum node is added to the final node mining result set, and dynamic correction candidate at each step is completed the propagation in the collection node repeat, the candidate set modification process and simulate the transmission process until it reaches the expected size of the set of nodes mining results, finally obtained the ideal node mining effect.

    【技術實現步驟摘要】
    基于貪心子圖的社會網絡節點挖掘方法
    本專利技術涉及的是一種社會網絡節點挖掘方法。
    技術介紹
    社會網絡中的節點挖掘方法主要分為啟發類方法和貪心類方法。前者主要是根據社會網絡節點自身屬性或者網絡自身拓撲結構來衡量網絡中各個節點的重要程度,如度中心性算法,由于其計算節點的重要性時僅考慮節點的鄰居拓撲結構,雖然其計算速度快,但是精確度欠佳;又如接近中心性算法和中介中心性算法,由于其計算時涉及到整個網絡拓撲,所以其算法效率很低。而后者則是通過傳播模型對于每一個節點進行傳播模擬,進而通過其傳播范圍的大小來計算節點的重要程度,該類算法由于結合了傳播模型進行真實傳播,算法效率低下,導致了其不適用于大型社會網絡。
    技術實現思路
    本專利技術的目的在于提供一種能夠解決現有的社會網絡影響力節點挖掘方法中啟發類方法在節點挖掘效果上不理想及貪心類方法在算法復雜度上極高這兩個問題的基于貪心子圖的社會網絡節點挖掘方法。本專利技術的目的是這樣實現的:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出個影響潛力最大的節點添加到候選集合C1中;步驟二:根據僵尸節點的定義,抽取社會網絡圖中符合條件的節點組成集合,并按照“僵尸節點”的本身特異性閾值從高到低排序,從排名中選取前個節點加入到候選集合C2中;步驟三:對于從候選集合C1中和候選集合C2中共抽取k個節點組成的集合C3,通過改進影響力的線性閾值模型表現為爬山貪婪算法進行傳播激活嘗試,初始時節點挖掘結果集S為空集,此時對集合C3中的每個節點進行傳播模擬,選取激活范圍最大的節點加入集合S中,完成第一個節點的選擇,同時對每一個被激活的節點進行標記,下一次傳播時默認為已激活節點不進行計算,每一次計算之后,剔除該社會網絡圖中被激活節點,抽取子圖進行下一次傳播;步驟四:通過步驟三的傳播后對集合C3以被標記為傳播過程中的已激活節點的節點進行剔除,此時C3中節點個數變少,重復步驟1和步驟2的節點選取過程,再次選取k個節點填充集合C3;步驟五:重復步驟三的激活傳播過程,直至節點挖掘結果集S達到規模k,結束。本專利技術還可以包括:1、節點的影響潛力的估計公式為:其中,Γ(i)是節點i的相鄰節點集合,C(j)代表節點j的聚集系數,di及dj分別代表節點i及節點j的度。2、節點i對節點j的影響力通過如下公式計算,式中,Pi代表源節點i的影響潛力,Pj代表節點j的影響潛力,C(i)為節點i的聚集系數。3、所述僵尸節點是激活閾值很高,所有的鄰居節點都處于激活狀態時其自身還無法被激活的節點,僵尸節點的定義通過如下公式表示:(1+γ)<θ>≤θv≤max{θ1,θ2...θn}其中,γ為僵尸節點的閾值調節參數,取值為[0,1],表示網絡中被選為僵尸節點的最低閾值參數,而僵尸節點閾值選取的范圍為介于(1+γ)<θ>和網絡中閾值最高節點的閾值之間;<θ>為網絡的平均閾值,網絡平均閾值有如下公式表示:式中,|V|為網絡中節點的數量,θi為節點i的特異性閾值,其取值在網絡進行第一次傳播之前根據網絡的特性隨機給出。本專利技術的目的是為了解決現有的社會網絡影響力節點挖掘算法中啟發類方法在節點挖掘效果上不理想及貪心類方法在算法復雜度上極高這兩個問題,提出的一種基于貪心子圖的節點挖掘改進方法。本專利技術針對于啟發類方法在節點挖掘效果上不理想及貪心類方法在算法復雜度上極高這兩個問題,采取先啟發后貪心合并計算的理論,提出了基于貪心子圖的社會網絡節點挖掘算法。該算法首先依據節點度這個重要屬性結合了局部拓撲結構的聚集系數估計出節點的影響潛力,根據影響潛力高低排序并加入種子節點候選集合,同時通過對網絡的整體評判排序并選擇出特異性閾值最高的節點加入種子節點候選集合。在完成候選集合的選擇后,通過改進影響力的線性閾值模型表現為貪心子圖策略對于集合中的節點進行真實的傳播模擬,選取增量影響范圍最大的節點加入到最終節點挖掘結果集合中,并且在每一步傳播完成時動態的修正候選集合中的節點,重復候選集合修正過程和傳播模擬過程直至達到預期規模的節點挖掘結果集合,最終得到理想的節點挖掘效果。本專利技術的特點主要體現在:目前,對于社會網絡影響力最大化節點挖掘算法,無論國內還是國外,都在積極的研究,學者們提出了多種模型方法和相應的算法,它們針對不同的網絡模型和具體的實際問題,各有特點。本專利技術在前人研究的基礎上,針對于現有的影響力最大化節點挖掘算法在節點選擇效果上的不穩定性以及算法執行效率上的低下,同時取其精華的結合了經典算法中的優點和創新,提出了基于節點貪心子圖的挖掘算法,其主要觀點和內容如下:(1)節點子圖影響潛力估計算法。線性閾值模型一直以來都是最經典的傳播模型之一,而在各種應用到該模型的算法中,需要得到模型中的影響力和特異性閾值,線性閾值模型中節點u對于鄰節點v存在的影響力buv通常用1/d(v)(d(v)表示網絡中節點v的度數)估計,這就表明,該節點周圍的所有鄰居節點對其的影響力大小都是相同的,顯然這并不符合實際,同時也忽略了節點之間的差異性。為了彌補其不足,本專利技術設計并實現了節點子圖影響潛力估計算法,通過影響潛力估計算法挑選出的節點,彌補了只考慮節點本身的缺陷,通過結合鄰居節點的拓撲結構更加合理的考慮了近鄰影響的效果,計算出社會網絡圖中每個節點的影響潛力。首先計算鄰居子圖中的節點對節點i的影響效果,公式中引入聚集系數C,用來測度網絡中長度為3的環形(即三角形),通俗的意義就是說你的兩個朋友,他們彼此也有可能互為朋友,這在一個社會網絡圖中是很容易存在的。在計算一個節點的影響效果時,同時考慮了節點本身以及鄰居子圖的一些拓撲度量系數,即鄰居子圖節點的度和節點的聚集系數。節點影響潛力估計公式定義為:其中,Γ(i)是節點i的相鄰節點集合,C(j)代表節點j的聚集系數,亦即通過節點的周圍相鄰的節點影響力,線性地反映出該節點本身的影響力。算法以度中心性為基礎,結合節點i的周圍鄰居節點的結構,通過引入鄰居節點的聚集系數同時作用在周圍節點的度指標上,這樣通過綜合節點本身的度,再加上節點周圍鄰居的結構,求得綜合作用下該節點在局部的重要程度。如當一個節點的某一個鄰居比較重要的話,相應的,該節點的重要性也會提升。而當網絡圖趨近于全圖,即從節點的局部信息來看就是節點的所有鄰居節點它們兩兩彼此之間都存在聯系,顯而易見,節點的重要程度遠沒有其為“橋”節點時高,所以節點的局部重要性與其聚集系數成反比。通過公式可以看出,當節點i的鄰居節點的聚集系數趨近于1時,節點影響潛力估計公式就趨近于度中心性算法,而鄰居節點的聚集系數越小,即鄰居節點的局部重要性越高,則節點的影響潛力受其鄰居節點的影響程度也就越大。與此同時,傳播模型中的節點影響力則根據節點的影響潛力計算公式遞進得出,在計算節點u對節點v的影響效果時,我們同時考慮了節點u及節點v本身的影響潛力,而這在現實應用中也是符合邏輯的,兩個人的地位不同,就決定了一個人對另一個人的影響效果是不同的,地位高的人通常對地位相對低的人影響力高一些,即地位高的人說話更有效果一些。(2)基于貪心子圖的節點挖掘算法。本專利技術的兩個算法是一種遞進關系,基于節點子圖的影響潛力估計算法,通過結合節點鄰居本文檔來自技高網...
    基于貪心子圖的社會網絡節點挖掘方法

    【技術保護點】
    一種基于貪心子圖的社會網絡節點挖掘方法,其特征是:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出

    【技術特征摘要】
    1.一種基于貪心子圖的社會網絡節點挖掘方法,其特征是:步驟一:輸入社會網絡圖,根據鄰居子圖節點影響潛力算法得出每個節點的影響潛力,把節點按照其影響潛力遞減的順序排序,并選出個影響潛力最大的節點添加到候選集合C1中;步驟二:根據僵尸節點的定義,抽取社會網絡圖中符合條件的節點組成集合,并按照“僵尸節點”的本身特異性閾值從高到低排序,從排名中選取前個節點加入到候選集合C2中;步驟三:對于從候選集合C1中和候選集合C2中共抽取k個節點組成的集合C3,通過改進影響力的線性閾值模型表現為爬山貪婪算法進行傳播激活嘗試,初始時節點挖掘結果集S為空集,此時對集合C3中的每個節點進行傳播模擬,選取激活范圍最大的節點加入集合S中,完成第一個節點的選擇,同時對每一個被激活的節點進行標記,下一次傳播時默認為已激活節點不進行計算,每一次計算之后,剔除該社會網絡圖中被激活節點,抽取子圖進行下一次傳播;步驟四:通過步驟三的傳播后對集合C3以被標記為傳播過程中的已激活節點的節點進行剔除,此時C3中節點個數變少,重復步驟1和步驟2的節點選取過程,再次選取k個節點填充集合C3;步驟五:重復步驟三的激活傳播過程,直至節點挖掘結果集S達到規模k,結束。2.根據權利要求1所述的基于貪心子圖的社會網絡節點挖掘方法,其特征是節點的影響潛力的估計公式為:

    【專利技術屬性】
    技術研發人員:王紅濱印桂生王念濱周連科張載熙馮夢園侯莎張玉鵬劉紅麗蘭方合
    申請(專利權)人:哈爾濱工程大學
    類型:發明
    國別省市:黑龍江,23

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码精品色午夜果冻不卡| 亚洲啪啪AV无码片| 无码免费一区二区三区免费播放| 亚洲AV无码一区二区三区系列| 亚洲看片无码在线视频| 黄A无码片内射无码视频| 亚洲AV成人噜噜无码网站| 国产精品成人无码久久久久久 | 无码日韩人妻AV一区免费l| 中文字幕av无码一区二区三区电影| 久久久久久人妻无码| 中文无码vs无码人妻| 精品少妇人妻av无码专区| 精品无码国产自产在线观看水浒传 | 亚洲一本到无码av中文字幕| 变态SM天堂无码专区| 性色av极品无码专区亚洲| 无码精品久久久久久人妻中字 | 亚洲&#228;v永久无码精品天堂久久| 国产成人亚洲综合无码精品| 无码国产亚洲日韩国精品视频一区二区三区| 亚洲av无码精品网站| 亚洲AV无码国产精品麻豆天美 | 久久久久久国产精品无码下载 | 免费无码VA一区二区三区| 一本一道AV无码中文字幕| 精品无码久久久久久久久久| 久久人午夜亚洲精品无码区| 亚洲av永久无码嘿嘿嘿| 亚洲AV无码久久寂寞少妇| 亚洲AV无码乱码在线观看富二代| 东京热人妻无码一区二区av| 国产亚洲?V无码?V男人的天堂 | 一本大道无码人妻精品专区| 国产精品久久无码一区二区三区网 | 国产成人综合日韩精品无码不卡| 久久久精品无码专区不卡| 亚洲精品无码乱码成人 | 亚洲国产精品无码久久SM| 亚洲人成无码网站| 无码国产精品一区二区免费3p|