一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統技術方案

技術編號：8682791 閱讀：295 留言：0更新日期：2013-05-09 02:44

本發明專利技術公開了一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統，系統包括對社會標簽語義相似度的計算方法分析模塊、兩種社會標簽相似度與評分相似度的融合模塊和基于K近鄰構建協同過濾推薦模塊三個部分，分析模塊根據項目之間的不同數據源來源，提出了除評分相似度以外的社會標簽語義相似度；對社會標簽語義相似度的計算，主要包括標簽對之間的相似度計算和標簽集合之前的相似度計算；融合模塊中兩種社會標簽相似度與評分相似度的融合方式包括按比例融合和以權重的方式融合兩種；最后將融合后的相似度度量基于K近鄰來構建協同過濾推薦系統。本發明專利技術將社會標簽數據信息和用戶－項目評分數據信息進行融合，從而達到提高推薦精度的目的。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術屬于數據挖掘的
，具體涉及一種融合了社會標簽相似度基于K近鄰的協同過濾推薦系統，適用于推薦結果的優化。
技術介紹
個性化推薦系統根據用戶個人不同的興趣愛好進行推薦，通常這種系統使用協同過濾技術來實現。在協同過濾推薦系統中，用戶對不同項目的喜好以一個用戶-項目評分矩陣來表示，越高的評分表明了用戶對項目更強的興趣。協同過濾技術使用已有的數據，處理和完成這個矩陣中缺失數據的估計問題。構造協同過濾推薦系統時最常用的兩類模型是近鄰關系模型和隱向量模型。近鄰關系模型構建用戶與用戶或者項目與項目之間的鄰居關系，使用用戶或項目鄰居之間已有的評分數據來做出評分預測。近鄰關系模型使用和集成起來更加簡單明了，其具備更高的靈活性，推薦結果也更加直觀和易于理解。本專利技術一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統采用近鄰關系模型。本專利技術通過融合社會標簽網絡中的語義信息來優化基于K近鄰模型的協同過濾算法?，F有的系統只考慮了社會標簽網絡信息或者簡單直接地使用了社會標簽網絡信息和評分數據。本系統旨在通過多數據源融合來優化傳統的K近鄰模型。系統使用社會標簽網絡的語義信息作為項目的相似度支持度，然后采取兩種與評分數據融合的策略，按比例融合和按權重融合。通過這兩種策略，K近鄰模型能夠提供更高的推薦精度，同時也可以通過降低K值從而降低計算的復雜度。
技術實現思路
本專利技術要解決的技術問題為:本專利技術通過提出一種新的度量標準，社會標簽相似度作為項目的相似度支持度，幫助優化K近鄰集合的質量。在這種新的度量標準之上，系統采取兩種融合策略來優化K近鄰模型的推薦精度和K值...

【技術保護點】
一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統，其特征在于：具體包括：（一）社會標簽語義相似度的計算方法分析模塊該分析模塊首先在給定的包含|I|個項目的社會標簽數據上對標簽信息進行分析，過濾，去重預處理，其中，I是項目集合，|I|代表項目集合I的個數；然后計算標簽與標簽之間的語義相似度，最后定義了標簽集合之間的語義相似度的計算方法，作為兩個項目之間的社會標簽相似度；標簽與標簽的相似度使用WordNet中的Wu?and?Palmers算法定義：SimWP(c1,c2)=2×depth(lso(c1,c2))len(c1,c2)+2×depth(lso(c1,c2))---(1)其中lso表示兩個詞語的公共父節點，depth表示一個詞語在語義樹中的深度，len是兩個詞語之間的路徑長度，Wu?and?Palmers算法的含義是，兩個詞語的語義相似度是由兩個詞語之間的路徑長度和其公共父節點的深度所共同決定的，因為一個詞語可能有多個含義，處于多個語義網，將使用兩個標簽不同含義之間，語義相似度最大值作為它們的相似度；社會標簽集合之間的語義相似度計算，對于給定的兩個社會標...

【技術特征摘要】
1.一種融合社會標簽相似度基于K近鄰的協同過濾推薦系統，其特征在于:具體包括: (一)社會標簽語義相似度的計算方法分析模塊該分析模塊首先在給定的包含III個項目的社會標簽數據上對標簽信息進行分析，過濾，去重預處理，其中，I是項目集合，Iil代表項目集合I的個數；然后計算標簽與標簽之間的語義相似度，最后定義了標簽集合之間的語義相似度的計算方法，作為兩個項目之間的社會標簽相似度；標簽與標簽的相似度使用WordNet中的Wu a...

【專利技術屬性】
技術研發人員：歐陽元新，顧毅，李日藩，熊璋，
申請(專利權)人：北京航空航天大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見