【技術實現步驟摘要】
個性化網址導航方法和裝置
本專利技術涉及瀏覽器
,具體涉及個性化網址導航方法和裝置。
技術介紹
隨著計算機技術的發展和互聯網用戶規模的不斷擴大,越來越多的互聯網用戶使用個人計算機通過互聯網獲得各種各樣所需的信息。同時,為互聯網用戶提供信息服務的網站也越來越多,互聯網網頁的數量每天都在以驚人的速度增長,互聯網信息呈現出爆發式的增長。對于用戶來說,經常需要通過一定的手段,才能在浩如煙海的互聯網信息中迅速定位最適合自己需求的網站或者需要的信息,比如通過網址導航服務。網址導航是一個集合較多網址,并按一定條件進行分類的一種網址站,主要為用戶提供網址導航服務。網址導航可以使用戶不用記憶網站的網址,就能通過網址導航頁面提供的鏈接方便找到自己需要的網站進行瀏覽和信息檢索。同時,現有的網址導航有的還提供了一些比較實用的功能,如號碼查詢、郵箱登陸、熱點新聞、搜索引擎入口等,在一定程度上也為用戶的互聯網沖浪提供了便利。據統計,目前有相當比例的互聯網用戶將瀏覽器的主頁設置為網址導航頁面,從一個側面也說明了網址導航服務在實際應用中確實有著方便用戶瀏覽的作用,從而受到了許多用戶的歡迎。然而,在現有的網址導航服務技術中,導航內容頁面大多是由網址導航產品的運營維護人員人工推薦的靜態頁面,雖然頁面內容內的導航網址可能涉及到許多門類,但相對于互聯網上數量巨大并且高速增長的信息量,網址導航內容往往不能夠適應互聯網用戶的瀏覽需求。
技術實現思路
鑒于上述問題,提出了本專利技術以便提供一種克服上述問題或者至少部分地解決上述問題的個性化網址導航方法和相應的裝置。依據本專利技術的一個方面,提供了一種 ...
【技術保護點】
一種個性化網址導航方法,包括:獲取多臺基于客戶端設備的訪問事件的群體歷史行為數據;根據所述群體歷史行為數據建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現客戶端設備訪問方群體訪問興趣點的類別信息;根據單個客戶端設備的個體歷史行為數據以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現客戶端設備訪問方個體訪問興趣點的類別信息;根據所述個體興趣模型確定在網址導航頁面中顯示的網址類別。
【技術特征摘要】
1.一種個性化網址導航方法,包括:獲取基于多臺客戶端設備的訪問事件的群體歷史行為數據;根據所述群體歷史行為數據建立客戶端設備訪問方的群體興趣模型,所述群體興趣模型為體現所述客戶端訪問方群體的訪問興趣的興趣模型,所述興趣模型中保存有體現客戶端設備訪問方群體訪問興趣點的類別信息;根據單個客戶端設備的個體歷史行為數據以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現客戶端設備訪問方個體訪問興趣點的類別信息,所述個體興趣模型為所述群體興趣模型的子集;根據各個訪問方的所述個體興趣模型確定在各個訪問方的網址導航頁面中顯示的網址類別;其中,所述根據單個客戶端設備的個體歷史行為數據以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括:從所述個體歷史行為數據中提取特征詞;根據所述群體興趣模型中保存的類別信息,對各個特征詞進行分類,得到若干個特征類別;保存各個特征類別,得到所述個體興趣模型。2.如權利要求1所述的方法,所述個體興趣模型中還保存有各個特征類別的權重,所述權重用于體現客戶端設備訪問方個體對各個類別的感興趣程度,所述根據各個訪問方的所述個體興趣模型確定在各個訪問方的網址導航頁面中顯示的網址類別包括:根據各個特征類別的權重對各個特征類別進行排序,根據排序結果確定在網址導航頁面中顯示的網址類別及排列順序。3.如權利要求1所述的方法,所述根據所述群體歷史行為數據建立客戶端設備訪問方的群體興趣模型包括:從所述群體歷史行為數據中提取特征詞;對所述從所述群體歷史行為數據中提取的特征詞進行聚類,獲得多個類別標簽,保存所述多個類別標簽,得到所述群體興趣模型。4.如權利要求3所述的方法,所述對所述特征詞進行聚類,獲得多個類別標簽包括:對所述從所述群體歷史行為數據中提取的特征詞進行歸一化處理;對歸一化處理后的特征詞進行聚類,獲得多個類別標簽。5.一種個性化網址導航方法,包括:獲取基于多臺客戶端設備的訪問事件的群體歷史行為數據;根據所述群體歷史行為數據建立客戶端設備訪問方的群體興趣模型,所述群體興趣模型為體現所述客戶端訪問方群體的訪問興趣的興趣模型,所述興趣模型中保存有體現客戶端設備訪問方群體訪問興趣點的類別信息;根據單個客戶端設備的個體歷史行為數據以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現客戶端設備訪問方個體訪問興趣點的類別信息,所述個體興趣模型為所述群體興趣模型的子集;根據各個訪問方的所述個體興趣模型確定在各個訪問方的網址導航頁面中顯示的網址類別;其中,所述個體興趣模型中還保存有各個特征類別的權重,所述權重用于體現客戶端設備訪問方個體對各個類別的感興趣程度,所述根據單個客戶端設備的個體歷史行為數據以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括:從所述個體歷史行為數據中提取特征詞,并獲取各個特征詞在所述個體歷史行為數據中的出現頻度;根據所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別;根據各個特征類別中包含的各個特征詞的出現頻度,獲得各個特征類別的權重;保存各個特征類別以及對應的權重,得到所述個體興趣模型。6.如權利要求5所述的方法,其特征在于,所述根據各個訪問方的所述個體興趣模型確定在各個訪問方的網址導航頁面中顯示的網址類別包括:根據各個特征類別的權重對各個特征類別進行排序,根據排序結果確定在網址導航頁面中顯示的網址類別及排列順序。7.如權利要求6所述的方法,所述群體興趣模型中的類別包括一級類別以及二級類別,每個一級類別下包括多個二級類別,并以二維矩陣的形式保存各個二級類別,其中,所述二維矩陣中的每一行對應每一一級類別下的各個二級類別,所述根據所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別包括:根據所述群體興趣模型中保存的二級類別信息,對所述特征詞進行分類,得到若干個二級特征類別;所述保存各個特征類別以及對應的權重包括:將各個二級特征類別的權重保存到所述二維矩陣對應的元素處;所述根據各個特征類別的權重對各個特征類別進行排序包括:分別將所述二維矩陣中每一行的各個二級特征類別的權重相加,得到一級特征類別的權重;根據各個一級特征類別的權重對各個一級特征類別進行排序,并根據各個二級特征類別的權重,對各個二級特征類別進行排序。8.如權利要求6所述的方法,所述根據各個特征類別中包含的各個特征詞的出現頻度,獲得各個特征類別的權重包括:分別對各個特征類別中包含的各個特征詞的出現頻度進行累加,得到各個特征類別的權重。9.如權利要求6所述的方法,所述根據各個特征類別中包含的各個特征詞的出現頻度,獲得各個特征類別的權重包括:根據搜索引擎服務器統計的特征詞熱點信息,獲取各個特征詞的熱點程度信息;根據各個特征詞的出現頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息;分別對各個特征類別中包含的各個特征詞的綜合頻度信息進行累加,得到各個特征類別的權重。10.如權利要求9所述的方法,所述根據各個特征詞的出現頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息包括:將特征詞的熱點程度信息乘以一加權系數,并與所述出現頻度進行相加,得到特征詞的綜合頻度信息;其中,所述加權系數小于1。11.如權利要求5所述的方法,其特征在于,所述根據所述群體歷史行為數據建立客戶端設備訪問方的群體興趣模型包括:從所述群體歷史行為數據中提取特征詞;對所述從所述群體歷史行為數據中提取的特征詞進行聚類,獲得多個類別標簽,保存所述多個類別標簽,得到所述群體興趣模型。12.如權利要求11所述的方法,所述對所述特征詞進行聚類,獲得多個類別標簽包括:對所述從所述群體歷史行為數據中提取的特征...
【專利技術屬性】
技術研發人員:周浩,鄧夏瑋,
申請(專利權)人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。