The embodiment of the invention relates to a user portrait grouping method and a device, which relates to the field of data analysis, and enables the user to draw images in a more stable and accurate manner. The method includes: each user portrait label label construction of network based on G (V, E), wherein V represents a tag network vertex set, each vertex represents a user portrait, E said the labels of edges in the network set, each edge represents two vertices and have at least one common label two users. Picture corresponding to the connection line; to construct a label network network based on G'(V', E', W'), among them, V'is the line graph network vertex set, each vertex labels an edge in a network, E' said the line graph of edges in the network set, each side that has two vertices two edges of common vertices corresponding to the graph in the network and the network connection label, W'said the line graph of edges in the network weights set; community division of line graph vertices of the network; will the partition result into user portrait clustering nodes Fruit.
【技術(shù)實(shí)現(xiàn)步驟摘要】
用戶畫像分群方法和裝置
本公開實(shí)施例涉及數(shù)據(jù)分析領(lǐng)域,具體地,涉及一種用戶畫像分群方法和裝置。
技術(shù)介紹
用戶畫像分群對于網(wǎng)絡(luò)營銷環(huán)境的最大改變在于打破了數(shù)據(jù)孤島并真實(shí)了解用戶,能夠?qū)⑸缃痪W(wǎng)絡(luò)中的一個個獨(dú)立用戶關(guān)聯(lián)起來并對其進(jìn)行分組。目前的用戶畫像分群方法對參數(shù)的依賴性非常強(qiáng),例如K-means算法對k的取值以及初始中心的向量選擇的依賴性很大,這使得用戶畫像分群的結(jié)果不穩(wěn)定。
技術(shù)實(shí)現(xiàn)思路
本公開實(shí)施例的目的是提供一種用戶畫像分群方法和裝置,能夠得到穩(wěn)定的用戶畫像分群結(jié)果。為了實(shí)現(xiàn)上述目的,本公開實(shí)施例提供一種用戶畫像分群方法,該方法包括:基于每個用戶畫像的標(biāo)簽構(gòu)建標(biāo)簽網(wǎng)絡(luò)G(V,E),其中V表示所述標(biāo)簽網(wǎng)絡(luò)中的頂點(diǎn)集合,每個頂點(diǎn)表示一個用戶畫像,E表示所述標(biāo)簽網(wǎng)絡(luò)中的邊集合,每條邊表示與擁有至少一個共同標(biāo)簽的兩個用戶畫像相對應(yīng)的兩個頂點(diǎn)之間的連線;基于所述標(biāo)簽網(wǎng)絡(luò)構(gòu)建線圖網(wǎng)絡(luò)G'(V',E',W'),其中,V'表示所述線圖網(wǎng)絡(luò)中的頂點(diǎn)集合,所述線圖網(wǎng)絡(luò)中的一個頂點(diǎn)表示所述標(biāo)簽網(wǎng)絡(luò)中的一條邊,E'表示所述線圖網(wǎng)絡(luò)中的邊集合,所述線圖網(wǎng)絡(luò)中的每條邊表示所述線圖網(wǎng)絡(luò)中與所述標(biāo)簽網(wǎng)絡(luò)中有公共頂點(diǎn)的兩條邊相對應(yīng)的兩個頂點(diǎn)之間的連線,W'表示所述線圖網(wǎng)絡(luò)中的邊的權(quán)值集合;基于所述線圖網(wǎng)絡(luò),對所述線圖網(wǎng)絡(luò)中的頂點(diǎn)進(jìn)行社團(tuán)劃分;將社團(tuán)劃分結(jié)果轉(zhuǎn)換成用戶畫像分群結(jié)果。可選地,所述線圖網(wǎng)絡(luò)中的邊的權(quán)值通過以下步驟來計(jì)算:計(jì)算所述標(biāo)簽網(wǎng)絡(luò)中的邊的權(quán)值;基于所計(jì)算的所述標(biāo)簽網(wǎng)絡(luò)中的邊的權(quán)值,計(jì)算所述標(biāo)簽網(wǎng)絡(luò)中每兩條有公共頂點(diǎn)的邊之間的相似度;將所述線圖網(wǎng)絡(luò)中的每條邊的權(quán)值設(shè)置為等于 ...
【技術(shù)保護(hù)點(diǎn)】
一種用戶畫像分群方法,其特征在于,該方法包括:基于每個用戶畫像的標(biāo)簽構(gòu)建標(biāo)簽網(wǎng)絡(luò)G(V,E),其中V表示所述標(biāo)簽網(wǎng)絡(luò)中的頂點(diǎn)集合,每個頂點(diǎn)表示一個用戶畫像,E表示所述標(biāo)簽網(wǎng)絡(luò)中的邊集合,每條邊表示與擁有至少一個共同標(biāo)簽的兩個用戶畫像相對應(yīng)的兩個頂點(diǎn)之間的連線;基于所述標(biāo)簽網(wǎng)絡(luò)構(gòu)建線圖網(wǎng)絡(luò)G′(V′,E′,W′),其中,V′表示所述線圖網(wǎng)絡(luò)中的頂點(diǎn)集合,所述線圖網(wǎng)絡(luò)中的一個頂點(diǎn)表示所述標(biāo)簽網(wǎng)絡(luò)中的一條邊,E′表示所述線圖網(wǎng)絡(luò)中的邊集合,所述線圖網(wǎng)絡(luò)中的每條邊表示所述線圖網(wǎng)絡(luò)中與所述標(biāo)簽網(wǎng)絡(luò)中有公共頂點(diǎn)的兩條邊相對應(yīng)的兩個頂點(diǎn)之間的連線,W′表示所述線圖網(wǎng)絡(luò)中的邊的權(quán)值集合;基于所述線圖網(wǎng)絡(luò),對所述線圖網(wǎng)絡(luò)中的頂點(diǎn)進(jìn)行社團(tuán)劃分;將社團(tuán)劃分結(jié)果轉(zhuǎn)換成用戶畫像分群結(jié)果。
【技術(shù)特征摘要】
1.一種用戶畫像分群方法,其特征在于,該方法包括:基于每個用戶畫像的標(biāo)簽構(gòu)建標(biāo)簽網(wǎng)絡(luò)G(V,E),其中V表示所述標(biāo)簽網(wǎng)絡(luò)中的頂點(diǎn)集合,每個頂點(diǎn)表示一個用戶畫像,E表示所述標(biāo)簽網(wǎng)絡(luò)中的邊集合,每條邊表示與擁有至少一個共同標(biāo)簽的兩個用戶畫像相對應(yīng)的兩個頂點(diǎn)之間的連線;基于所述標(biāo)簽網(wǎng)絡(luò)構(gòu)建線圖網(wǎng)絡(luò)G′(V′,E′,W′),其中,V′表示所述線圖網(wǎng)絡(luò)中的頂點(diǎn)集合,所述線圖網(wǎng)絡(luò)中的一個頂點(diǎn)表示所述標(biāo)簽網(wǎng)絡(luò)中的一條邊,E′表示所述線圖網(wǎng)絡(luò)中的邊集合,所述線圖網(wǎng)絡(luò)中的每條邊表示所述線圖網(wǎng)絡(luò)中與所述標(biāo)簽網(wǎng)絡(luò)中有公共頂點(diǎn)的兩條邊相對應(yīng)的兩個頂點(diǎn)之間的連線,W′表示所述線圖網(wǎng)絡(luò)中的邊的權(quán)值集合;基于所述線圖網(wǎng)絡(luò),對所述線圖網(wǎng)絡(luò)中的頂點(diǎn)進(jìn)行社團(tuán)劃分;將社團(tuán)劃分結(jié)果轉(zhuǎn)換成用戶畫像分群結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述線圖網(wǎng)絡(luò)中的邊的權(quán)值通過以下步驟來計(jì)算:計(jì)算所述標(biāo)簽網(wǎng)絡(luò)中的邊的權(quán)值;基于所計(jì)算的所述標(biāo)簽網(wǎng)絡(luò)中的邊的權(quán)值,計(jì)算所述標(biāo)簽網(wǎng)絡(luò)中每兩條有公共頂點(diǎn)的邊之間的相似度;將所述線圖網(wǎng)絡(luò)中的每條邊的權(quán)值設(shè)置為等于該邊的兩個頂點(diǎn)在所述標(biāo)簽網(wǎng)絡(luò)中對應(yīng)的兩條邊之間的相似度。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述標(biāo)簽網(wǎng)絡(luò)中的邊的權(quán)值通過以下公式計(jì)算:其中,i和j表示所述標(biāo)簽網(wǎng)絡(luò)中的兩個頂點(diǎn),eij表示頂點(diǎn)i和j之間的邊,wij表示邊eij的權(quán)值。4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述相似度通過以下公式計(jì)算:其中,i、j、k和m表示所述標(biāo)簽網(wǎng)絡(luò)中的頂點(diǎn),eik表示頂點(diǎn)i和k之間的邊,ejk表示頂點(diǎn)j和k之間的邊,邊eik和ejk連接相同的頂點(diǎn)k,Ni表示由頂點(diǎn)i的所有鄰居頂點(diǎn)構(gòu)成的集合,且i∈Ni,Nj表示由頂點(diǎn)j的所有鄰居頂點(diǎn)構(gòu)成的集合,wim表示頂點(diǎn)i和m之間的邊eim的權(quán)值,wjm表示頂點(diǎn)j和m之間的邊ejm的權(quán)值。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將社團(tuán)劃分結(jié)果轉(zhuǎn)換成用戶畫像分群結(jié)果,包括:將所述線圖網(wǎng)絡(luò)中被劃分到同一個社團(tuán)的頂點(diǎn)所對應(yīng)的所述標(biāo)簽網(wǎng)絡(luò)中的頂點(diǎn)劃分到同一個用戶畫像分群中。6.一種用戶畫像分群裝置,其特征在于,該裝置包括:...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王陽,
申請(專利權(quán))人:東軟集團(tuán)股份有限公司,
類型:發(fā)明
國別省市:遼寧,21
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。