本發明專利技術是一種在社交媒體網絡上自動篩選有影響力用戶的方法,包括步驟如下:步驟S1:利用超圖模型為興趣社交媒體網絡中的用戶、興趣對象及其相互作用關系建模;步驟S2:采用超圖約束的正則化主題概率模型,利用興趣對象的內容信息和內容信息之間的相似性關系作為約束,自動學習得到隱含的興趣主題;步驟S3:對每個用戶和興趣對象進行主題影響力排序,采用相似性傳播模型及在超圖上的用戶和興趣對象及相互之間的超邊傳播主題影響力,直到穩態,然后排序可得到特定主題下的有影響力的用戶。本發明專利技術能夠真實而準確地反映用戶影響力在社交媒體網絡中的分布。
【技術實現步驟摘要】
本專利技術屬于數字信息處理
,具體涉及一種社交媒體網絡的數據篩選技術,特別是基于多媒體內容與鏈接分析的主題敏感有影響力用戶的篩選方法。
技術介紹
社交媒體網絡的出現和繁榮發展,改變了人們獲取和消費信息的方式。各種社交媒體網絡為人們提供了一個可以便捷創造和分享興趣內容的平臺。比如,新浪、騰訊微博的短訊圖片分享,twitter的短訊,Flickr的圖片分享等。然而,一個顯著的存在問題是,人們在便捷獲取信息的同時,也面臨信息過載的問題。人們獲取信息時,會傾向于獲取自己感興趣的內容和把有影響力的用戶作為信息源。從社交媒體網絡中篩選出在某一領域或主題下有影響力的用戶或是興趣對象,成為當前學術界和工業界關注的熱點。通過篩選出主題敏感的用戶,一種“興趣達人”或“意見領袖”,從而商家可以進行影響力營銷推廣,用戶可以更好地有目標性地獲取所感興趣所需要的知識信息。目前針對有影響力用戶的篩選,現有的方法有一種是專家發現方法,即給定一個主題,鑒別出有相關的技能或經驗的人。現有的工作主要集中在文本數據上,沒有涉及多媒體數據,即各種用戶感興趣的信息載體,比如音頻、圖片、視頻等。另一種是社交媒體網絡的影響力分析,即分析社交媒體網絡并對社交媒體網絡中的影響力進行建模,了解社交媒體網絡的動態發展情況。現有主要工作是在社交網絡中鑒別影響力的存在或者是在同質網絡中量化影響力。然而,上述方法不能完全真實準確地反映用戶影響力在社交網絡中的分布,用戶影響力在社交網絡中是一個連續性的可量化的變量,并且用戶的影響力是主題敏感的,即在不同的主題上,用戶的影響力分布是不同的。傳統的方法,一方面大多方法局限于文本數據處理度量用戶影響力,而實際上社交網絡中包含豐富的多媒體數據,這些信息對用戶影響力建模具有重要的作用。另一方面傳統方法是對用戶一般化的影響力建模,沒有考慮主題敏感的影響力建模。
技術實現思路
(一 )要解決的技術問題本專利技術所要解決的技術問題是如何自動地從社交媒體網絡中關于特定的主題篩選出影響力的用戶,并克服當前方法只在文本數據上為用戶影響力建模的局限和僅限于用戶全局影響力的度量。( 二 )技術方案為解決上述技術問題,本專利技術提出一種,該方法包括步驟如下步驟S1:利用超圖模型為興趣社交媒體網絡中的用戶、興趣對象及其相互作用關系建模;步驟S2 :采用超圖約束的正則化主題概率模型,利用興趣對象的內容信息和內容信息之間的相似性關系作為約束,自動學習得到隱含的興趣主題;步驟S3 :對每個用戶和興趣對象進行主題影響力排序,采用相似性傳播模型及在超圖上的用戶和興趣對象及相互之間的超邊傳播主題影響力,直到穩態,然后排序可得到特定主題下的有影響力的用戶。(三)有益效果本專利技術利用社交媒體網絡中包含的各種媒體內容自動地發現潛在的主題,并分析相應的主題下的有影響力用戶,能夠在多模態異質網絡中利用多媒體數據和各種社交鏈接關系挖掘出主題敏感的用戶。并且,本專利技術能夠真實而準確地反映用戶影響力在社交媒體網絡中的分布,篩選出社交媒體網絡中主題敏感的有影響力用戶。附圖說明圖1是本專利技術的流程圖;圖2是根據本專利技術的基于視覺內容構建的同質超邊示意圖;圖3是根據本專利技術的基于文本內容構建的同質超邊示意圖;圖4是根據本專利技術的異質超邊示意圖;圖5是本專利技術的超圖中影響力消息傳播示意圖;圖6a和圖6b是根據本專利技術的一個實施例的方法所得到的代表性用戶和圖片。具體實施例方式為使本專利技術的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本專利技術作進一步的詳細說明。本專利技術的目標是篩選出社交媒體網絡中主題敏感的有影響力用戶。本專利技術中的社交媒體網絡指的是指為用戶提供的一個可以創造和分享媒體信息的平臺,例如圖片分享網站Flickr。本專利技術中所稱的用戶指的是社交媒體網絡中的主體對象即人,所稱的興趣對象指的是由用戶創造和分享的特定對象,如圖片、視頻、音樂。所謂主題指的是興趣對象在語義層次上的聚合表達,具體表現形式為語義相近的詞的概率分布。有影響力用戶是指在社交網絡中能夠對其他用戶的網絡行為比如轉發、評論等產生直接或間接影響的用戶,所謂的影響力定義為當用戶的情緒、意見或行為受到其他人的作用的一種表現形式。本專利技術的社交媒體網絡指的是以興趣對象為中心的,為用戶提供的一個創造和分享興趣對象的平臺,興趣對象可以是短訊、圖片、視頻、音樂等,在社交媒體網絡中存在豐富的多媒體數據,多模態和異質的,比如在Flickr中,存在文本、圖片、視頻,并且在用戶和圖片之間存在評論、轉發、喜愛等鏈接關系。概括地說,本專利技術利用社交媒體網絡中包含的各種媒體內容自動地發現潛在的主題,并分析相應的主題下的有影響力用戶。本專利技術能夠在多模態異質網絡中利用多媒體數據和各種社交鏈接關系挖掘出主題敏感的用戶。下面具體說明本專利技術的實施方式。圖1所示為本專利技術的有影響力用戶篩選方法的流程圖。如圖1所示,本專利技術包括三個步驟S1、超圖構建(hypergraph construction) ;S2、興趣主題分布學習(Topicof interest distribution learning) ;S3、主題敏感影響力排序(Topic sensitiveinfluence ranking)。下面分別說明各個步驟。S1、超圖構建所謂超圖指的是能夠表不多階關系的圖。在超圖中,包含節點和超邊G = (V, E,W),其中節點表示不同類型的對象,而超邊可以連接多于兩個節點表示相互之間高階關系。超圖能夠對包含高階關系的對象網絡進行建模。步驟SI是運用超圖模型來為社交媒體網絡中的用戶、興趣對象及其相互作用關系進行建模的步驟。在社交媒體網絡中,用戶和興趣對像是最基本的元素,其間存在多種鏈接關系,比如用戶可以評論、轉發、喜愛和評論一個興趣對象。在本專利技術中,用超圖節點表示社交媒體網絡中的用戶(user)和興趣對象(objectof interest, 01);超邊分為兩種類型同質(homogeneous)超邊和異質(heterogeneous)超邊。同質超邊用于表示興趣對象之間的內容相似性,包括視覺內容相似性和文本內容相似性,異質超邊用于表示用戶和興趣對象之間的高階社交鏈接關系,如用戶和興趣對象之間存在的喜歡和評論關系。 圖2為構建基于視覺內容相似性的同質超邊的示意圖,如圖2所示,本專利技術采用K近鄰的方法,即對于每一個興趣對象,找到其K個最近鄰的興趣對象,然后用一條同質超邊連接這些節點,并且權重設為I。對于文本內容相似性,本專利技術構建基于文本標簽的同質超邊,圖3為構建基于文本相似性的超邊的示意圖,如圖3所示,首先從所有興趣對象的文本元數據抽取一個詞典,然后對于每一個詞,為所有包含該詞的興趣對象建立一條超邊,并且權重設為I。對于異質超邊,本專利技術主要考慮兩種一種異質超邊是“擁有者-多個興趣對象-單一用戶”(owner-01s_user)的超邊,其連接的是擁有者(用戶A)和另一個用戶B以及他們之間的交互的多個興趣對象,用戶B對用戶A的多個興趣對象表現出興趣行為,比如評論或喜歡;該超邊的權重為I。另一種異質超邊是擁有者-單一興趣對象-多個用戶(owner-01-users)的超邊,其連接的是擁有者(用戶A)和一個興趣對象以及對該興趣對象產生興趣行為的多個用戶。該超邊的權重為I。本文檔來自技高網...
【技術保護點】
一種在社交媒體網絡上自動篩選有影響力用戶的方法,其特征在于,該方法包括步驟如下:步驟S1:利用超圖模型為興趣社交媒體網絡中的用戶、興趣對象及其相互作用關系建模;步驟S2:采用超圖約束的正則化主題概率模型,利用興趣對象的內容信息和內容信息之間的相似性關系作為約束,自動學習得到隱含的興趣主題;步驟S3:對每個用戶和興趣對象進行主題影響力排序,采用相似性傳播模型及在超圖上的用戶和興趣對象及相互之間的超邊傳播主題影響力,直到穩態,然后排序可得到特定主題下的有影響力的用戶。
【技術特征摘要】
1.一種在社交媒體網絡上自動篩選有影響力用戶的方法,其特征在于,該方法包括步驟如下 步驟S1:利用超圖模型為興趣社交媒體網絡中的用戶、興趣對象及其相互作用關系建模; 步驟S2 :采用超圖約束的正則化主題概率模型,利用興趣對象的內容信息和內容信息之間的相似性關系作為約束,自動學習得到隱含的興趣主題; 步驟S3 :對每個用戶和興趣對象進行主題影響力排序,采用相似性傳播模型及在超圖上的用戶和興趣對象及相互之間的超邊傳播主題影響力,直到穩態,然后排序可得到特定主題下的有影響力的用戶。2.根據權利要求1所述的在社交媒體網絡上自動篩選有影響力用戶的方法,其特征在于,所述步驟SI包括用超圖節點表示社交媒體網絡中的用戶和興趣對象,用同質超邊表示興趣對象之間的內容相似性,用異質超邊表示用戶和興趣對象之間的高階社交鏈接關系。3.根據權利要求2所述的在社交媒體網絡上自動篩選有影響力用戶的方法,其特征在于,所述興趣對象之間的內容相似性包括視覺內容相似性和文本內容相似性,并且, 用于表示視覺內容相似性的超邊構建步驟為對于每一個興趣對象,找到其K個最近鄰的興趣對象,然后用一條同質超邊連接這些節點,并且權重設為I ; 用于表示文本內容相似性的超邊構建步驟為首先從所有興趣對象的文本元數據抽取一個詞典,然后對于每一個詞,為所有包含該詞...
【專利技術屬性】
技術研發人員:徐常勝,桑基韜,方全,
申請(專利權)人:中國科學院自動化研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。