本發(fā)明專利技術(shù)屬于社交網(wǎng)絡(luò)上可信度研究體系中的用戶可信度的研究范疇,涉及一種微博平臺上的僵尸用戶探測方法,建立模型解決微博平臺上的僵尸用戶的探測問題,把僵尸用戶的探測這一抽象的問題,與用戶可信度的評估問題緊密的結(jié)合起來,通過建立起僵尸用戶評估得分模型和僵尸用戶概率判定模型,并且在僵尸用戶概率劃分模型中建立起一系列閾值,用于界定僵尸用戶的級別。通過僵尸用戶評估得分模型和僵尸用戶概率判定模型的結(jié)合對微博平臺上的用戶一一進(jìn)行僵尸用戶的甄別。
【技術(shù)實(shí)現(xiàn)步驟摘要】
【技術(shù)保護(hù)點(diǎn)】
一種微博平臺上的僵尸用戶探測方法,其特征在于,包括以下步驟:步驟1,建立通配算子Z如下,Z=(Tw,Fr,Fa,Bf)其中,四個(gè)特征向量Tw,Fr,Fa,Bf表示四個(gè)影響因子,分別為微博數(shù)、關(guān)注數(shù)、收藏?cái)?shù)和互粉數(shù);步驟2,根據(jù)采用的影響因子,對用戶計(jì)算通配算子Z對時(shí)間的一階偏導(dǎo)數(shù)和二階偏導(dǎo)數(shù)實(shí)現(xiàn)方式如下,采用的影響因子為微博數(shù)時(shí),計(jì)算微博數(shù)變化率如下,Tw(Δ)=Tw(i)-Tw(j)t=Tw′其中,Tw(i)表示時(shí)刻i用戶發(fā)表的微博數(shù),Tw(j)表示時(shí)刻j用戶發(fā)表的微博數(shù),Tw′表示用戶發(fā)表的微博數(shù)對時(shí)間的一階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;計(jì)算微博數(shù)對時(shí)間的二階導(dǎo)數(shù)如下,Tw′(Δ)=Tw′(i)-Tw′(j)t=Tw′′其中,Tw′(i)表示時(shí)刻i用戶的微博數(shù)對時(shí)間的一階導(dǎo)數(shù),Tw′(j)表示時(shí)刻j用戶的微博數(shù)對時(shí)間的一階導(dǎo)數(shù),Tw″表示用戶的微博數(shù)對時(shí)間的二階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;采用的影響因子為關(guān)注數(shù)時(shí),計(jì)算關(guān)注數(shù)變化率如下,F(xiàn)r(Δ)=Fr(i)-Fr(j)t=Fr′其中,F(xiàn)r(i)表示時(shí)刻i用戶的關(guān)注數(shù),F(xiàn)r(i)表示時(shí)刻j用戶的關(guān)注數(shù),F(xiàn)r′表示用戶的關(guān)注數(shù)對時(shí)間的一階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;計(jì)算關(guān)注數(shù)對時(shí)間的二階導(dǎo)數(shù)如下,F(xiàn)r′(Δ)=Fr′(i)-Fr′(j)t=Fr′′其中,F(xiàn)r′(i)表示時(shí)刻i用戶的關(guān)注數(shù)對時(shí)間的一階導(dǎo)數(shù),F(xiàn)r′(j)表示時(shí)刻j用戶的關(guān)注數(shù)對時(shí)間的一階導(dǎo)數(shù),F(xiàn)r″表示用戶的關(guān)注數(shù)對時(shí)間的二階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;采用的影響因子為收藏?cái)?shù)時(shí),計(jì)算收藏?cái)?shù)變化率如下,F(xiàn)a(Δ)=Fa(i)-Fa(j)t=Fa′其中,F(xiàn)a(i)表示時(shí)刻i用戶的收藏?cái)?shù),F(xiàn)a(i)表示時(shí)刻j用戶的收藏?cái)?shù),F(xiàn)a′表示用戶的收藏?cái)?shù)對時(shí)間的一階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;計(jì)算收藏?cái)?shù)對時(shí)間的二階導(dǎo)數(shù)如下,F(xiàn)a′(Δ)=Fa′(i)-Fa′(j)t=Fa′′其中,F(xiàn)a′(i)表示時(shí)刻i用戶的收藏?cái)?shù)對時(shí)間的一階導(dǎo)數(shù),F(xiàn)a′(j)表示時(shí)刻j用戶的收藏?cái)?shù)對時(shí)間的一階導(dǎo)數(shù),F(xiàn)a″表示用戶的收藏?cái)?shù)對時(shí)間的二階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;采用的影響因子為互粉數(shù)時(shí),計(jì)算互粉數(shù)變化率如下,Bf(Δ)=Bf(i)-Bf(j)t=Bf′其中,Bf(i)表示時(shí)刻i用戶的互粉數(shù),Bf(j)表示時(shí)刻j用戶的互粉數(shù),Bf′表示用戶的互粉數(shù)對時(shí)間的一階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;計(jì)算互粉數(shù)對時(shí)間的二階導(dǎo)數(shù)如下,Bf′(Δ)=Bf′(i)-Bf′(j)t=Bf′′其中,Bf′(i)表示時(shí)刻i用戶的互粉數(shù)對時(shí)間的一階導(dǎo)數(shù),Bf′(j)表示時(shí)刻j用戶的互粉數(shù)對時(shí)間的一階導(dǎo)數(shù),Bf″表示用戶的互粉數(shù)對時(shí)間的二階導(dǎo)數(shù),t表示時(shí)刻i與時(shí)刻j的時(shí)間差;步驟3,以時(shí)間為X軸、以影響因子為Y軸生成曲線,定義僵尸粉判別算子如下并進(jìn)行計(jì)算,η=0Z′′=0∑Z′Z′′Z′′≠0η等于0時(shí),表明用戶從該時(shí)刻開始進(jìn)入蟄伏期,當(dāng)蟄伏期大于預(yù)設(shè)的閾值λ時(shí),則認(rèn)為該用戶為僵尸粉的概率為100%;步驟4,定義曲線在某一時(shí)刻T的切線與X軸形成的夾角為θ,定義夾角θ的正弦值sinθ為該用戶的活躍度得分,計(jì)算公式如下,S(T)=sinθ基于上述表達(dá)式,得出探測僵尸用戶的探測模型如下,P(T)=(1?sinθ)×100%P(T)表示用戶在某一時(shí)刻T被計(jì)算模型判定為僵尸用戶的概率。FDA00002753364000011.jpg,FDA00002753364000012.jpg...
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李石君,王峰,余偉,甘琳,楊莎,王俊,劉晶,丁永剛,
申請(專利權(quán))人:武漢大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。