• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統技術方案

    技術編號:8682791 閱讀:295 留言:0更新日期:2013-05-09 02:44
    本發明專利技術公開了一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統,系統包括對社會標簽語義相似度的計算方法分析模塊、兩種社會標簽相似度與評分相似度的融合模塊和基于K近鄰構建協同過濾推薦模塊三個部分,分析模塊根據項目之間的不同數據源來源,提出了除評分相似度以外的社會標簽語義相似度;對社會標簽語義相似度的計算,主要包括標簽對之間的相似度計算和標簽集合之前的相似度計算;融合模塊中兩種社會標簽相似度與評分相似度的融合方式包括按比例融合和以權重的方式融合兩種;最后將融合后的相似度度量基于K近鄰來構建協同過濾推薦系統。本發明專利技術將社會標簽數據信息和用戶-項目評分數據信息進行融合,從而達到提高推薦精度的目的。

    【技術實現步驟摘要】

    本專利技術屬于數據挖掘的
    ,具體涉及一種融合了社會標簽相似度基于K近鄰的協同過濾推薦系統,適用于推薦結果的優化。
    技術介紹
    個性化推薦系統根據用戶個人不同的興趣愛好進行推薦,通常這種系統使用協同過濾技術來實現。在協同過濾推薦系統中,用戶對不同項目的喜好以一個用戶-項目評分矩陣來表示,越高的評分表明了用戶對項目更強的興趣。協同過濾技術使用已有的數據,處理和完成這個矩陣中缺失數據的估計問題。構造協同過濾推薦系統時最常用的兩類模型是近鄰關系模型和隱向量模型。近鄰關系模型構建用戶與用戶或者項目與項目之間的鄰居關系,使用用戶或項目鄰居之間已有的評分數據來做出評分預測。近鄰關系模型使用和集成起來更加簡單明了,其具備更高的靈活性,推薦結果也更加直觀和易于理解。本專利技術一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統采用近鄰關系模型。本專利技術通過融合社會標簽網絡中的語義信息來優化基于K近鄰模型的協同過濾算法?,F有的系統只考慮了社會標簽網絡信息或者簡單直接地使用了社會標簽網絡信息和評分數據。本系統旨在通過多數據源融合來優化傳統的K近鄰模型。系統使用社會標簽網絡的語義信息作為項目的相似度支持度,然后采取兩種與評分數據融合的策略,按比例融合和按權重融合。通過這兩種策略,K近鄰模型能夠提供更高的推薦精度,同時也可以通過降低K值從而降低計算的復雜度。
    技術實現思路
    本專利技術要解決的技術問題為:本專利技術通過提出一種新的度量標準,社會標簽相似度作為項目的相似度支持度 ,幫助優化K近鄰集合的質量。在這種新的度量標準之上,系統采取兩種融合策略來優化K近鄰模型的推薦精度和K值來降低計算復雜度,從而構建出更好的基于K近鄰的協同過濾推薦系統本專利技術解決上述技術問題采用的技術方案為:一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統,其特征在于:具體包括:(一)社會標簽語義相似度的計算方法分析模塊該分析模塊首先在給定的包含I I I個項目的社會標簽數據上對標簽信息進行分析,過濾,去重預處理,其中,I是項目集合,I代表項目集合I的個數;然后計算標簽與標簽之間的語義相似度,最后定義了標簽集合之間的語義相似度的計算方法,作為兩個項目之間的社會標簽相似度;標簽與標簽的相似度使用WordNet中的Wu and Palmers算法定義:本文檔來自技高網...

    【技術保護點】
    一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統,其特征在于:具體包括:(一)社會標簽語義相似度的計算方法分析模塊該分析模塊首先在給定的包含|I|個項目的社會標簽數據上對標簽信息進行分析,過濾,去重預處理,其中,I是項目集合,|I|代表項目集合I的個數;然后計算標簽與標簽之間的語義相似度,最后定義了標簽集合之間的語義相似度的計算方法,作為兩個項目之間的社會標簽相似度;標簽與標簽的相似度使用WordNet中的Wu?and?Palmers算法定義:SimWP(c1,c2)=2×depth(lso(c1,c2))len(c1,c2)+2×depth(lso(c1,c2))---(1)其中lso表示兩個詞語的公共父節點,depth表示一個詞語在語義樹中的深度,len是兩個詞語之間的路徑長度,Wu?and?Palmers算法的含義是,兩個詞語的語義相似度是由兩個詞語之間的路徑長度和其公共父節點的深度所共同決定的,因為一個詞語可能有多個含義,處于多個語義網,將使用兩個標簽不同含義之間,語義相似度最大值作為它們的相似度;社會標簽集合之間的語義相似度計算,對于給定的兩個社會標簽集合A,B,tagi和tagj表示集合中的兩個標簽,令simi,j表示標簽之間的相似度;使用一個矩陣來存儲A和B中的標簽兩兩之間的相似度,這樣就將社會標簽集合之間的語義相似度的計算問題轉化為了尋找最大二分匹配的問題,問題的目標就是找到標簽之間最大可能匹配的數目;FSimA,B=NA-matching-pairs+NB-matching-pairs|A|+|B|---(2)式(2)中,兩個標簽集合AB的語義相似度用FSimAB來表示,定義標簽相似度大于設置的閾值時,為兩個標簽之間匹配,NA?matching?pairs和NB?matching?pairs分別表示從兩個集合的優先考慮角度來尋找的匹配標簽數目;(二)兩種社會標簽相似度和評分相似度的融合模塊該融合模塊使用社會標簽相似度作為相似度支持的兩種融合策略:一種是按比例融合的方法,其按比例融合的方法將兩種相似度按比例融合在一起,社會標簽相似度和評分相似度分別貢獻自己的相似度的比例值;另外一種是以權重融合的方法,其以權重融合的方法考慮到評分相似度和社會標簽相似度的特殊性,將使用社會標簽相似度來作為權重修正評分相似 度:越高的社會標簽相似度表示其評分相似度的置信度越高;具體的:(1)按比例融合的方法這種方法將兩種相似度按比例融合在一起,社會標簽相似度和評分相似度分別貢獻自己的相似度的比例值;給定兩個項目i和j,RS表示它們的評分相似度,FS是社會標簽相似度,那么i和j最終的相似度計算方法是:Simi,j=λ·FSi,j+(1?λ)·RSi,j????(3)其中的λ是比例系數,從0到1之間取值,根據實際系統的需要和運行性能選取合適的值;(2)以權重融合的方法這種策略考慮到評分相似度和社會標簽相似度的特殊性,將使用社會標簽相似度來作為權重修正評分相似度:越高的社會標簽相似度表示其評分相似度的置信度越高;Simi,j=RSi,j·FSi,j-min(FS)max(FS)-min(FS)---(4)其中max(FS)和min(FS)代表訓練數據中所有項目的最大最小社會標簽相似度的值;通過這種方法將評分相似度轉化成一個新值,在K近鄰的構建時,最近鄰居的選擇將會傾向于評分相似度和社會標簽相似度都高的項目,而不是僅僅由一種相似度所決定;(三)使用融合后的相似度信息基于K近鄰構建協同過濾推薦模塊該推薦模塊通過在基于不同數據源的模型上計算項目之間的各種相似度,社會標簽相似度項目相似度以支持度的方式集成到K近鄰模型中去,來改善模型的性能,通過兩種融合社會標簽語義相似度和評分相似度的方法,包括以百分比融合和以權重融合,構建出基于K近鄰的協同過濾推薦系統可以更好地通過已知數據預測出未知數據的評分信息,具有更高的推薦精度;項目之間的相似度采用Pearson相關相似度來計算,Simi,j=Σu∈Ri∩Rj(ru,i-ri‾)·(ru,j-rj‾)Σu∈Ri∩Rj(ru,i-ri‾)2·Σu∈Ri∩Rj(ru,j-rj‾)2---(5)其中的是項目i的平均評分,用戶用u表示,i,j表示不同的項目,通...

    【技術特征摘要】
    1.一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統,其特征在于:具體包括: (一)社會標簽語義相似度的計算方法分析模塊 該分析模塊首先在給定的包含III個項目的社會標簽數據上對標簽信息進行分析,過濾,去重預處理,其中,I是項目集合,Iil代表項目集合I的個數;然后計算標簽與標簽之間的語義相似度,最后定義了標簽集合之間的語義相似度的計算方法,作為兩個項目之間的社會標簽相似度; 標簽與標簽的相似度使用WordNet中的Wu a...

    【專利技術屬性】
    技術研發人員:歐陽元新,顧毅,李日藩,熊璋,
    申請(專利權)人:北京航空航天大學,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 丝袜无码一区二区三区| 日韩少妇无码一区二区三区| 亚洲综合最新无码专区| 国产成人无码av在线播放不卡| 中国无码人妻丰满熟妇啪啪软件 | 色综合久久无码五十路人妻| 无码中文字幕一区二区三区| 毛片亚洲AV无码精品国产午夜| 国产成人无码精品久久久性色 | 一本色道无码道DVD在线观看| 国产AV无码专区亚洲AV琪琪| 无码孕妇孕交在线观看| 五月丁香六月综合缴清无码| 亚洲午夜无码久久久久软件| 久久人妻内射无码一区三区| 国产午夜鲁丝片AV无码免费 | 熟妇人妻无码xxx视频| 国产成人精品一区二区三区无码 | 日韩亚洲AV无码一区二区不卡| 狠狠精品干练久久久无码中文字幕| 国产成人精品无码免费看| 免费A级毛片无码久久版| 99久久人妻无码精品系列| 亚洲AV永久无码精品一百度影院| 国产做无码视频在线观看| 亚洲爆乳无码精品AAA片蜜桃| 无码无套少妇毛多18p| 成人无码午夜在线观看| 国产成人无码网站| 国产成人无码精品久久久露脸| 亚洲中文字幕久久精品无码VA| 亚洲国产av高清无码| 蜜桃臀无码内射一区二区三区| 亚洲AV无码精品色午夜果冻不卡| 亚洲精品无码午夜福利中文字幕 | 在线播放无码后入内射少妇| 亚洲av无码不卡私人影院| 日韩av片无码一区二区三区不卡| 色综合久久久无码中文字幕波多| 亚洲精品久久无码| 国产精品无码专区AV在线播放|