The invention provides a search control method and system. The method comprises: acquiring user quality labels corresponding to the user request, the user quality label is used according to the user history; and at least based on the quality of the user label given with user request corresponding to the search results. As a result, the corresponding level of search results can be returned according to the quality grade of the user. In addition, the search service level for some or all of the users can also be adjusted according to the current traffic of the search system.
【技術實現步驟摘要】
搜索控制方法和系統
本專利技術涉及網絡技術,尤其涉及一種搜索控制方法和系統。
技術介紹
搜索服務方需要夜以繼日地為網絡用戶提供各種各類的搜索服務。搜索后臺是一個復雜的系統,每一次查詢都會涉及到數百個節點的服務,耗費大量的機器資源。為了保證提供優質的搜索服務,搜索服務方需要識別爬蟲,將其剔除搜索系統以保護優質資源。在傳統的搜索系統中,爬蟲識別功能單一,通常是統計IP或者用戶ID等信息的訪問頻率等。如果訪問頻率高于某個閾值則返回一個輸入驗證碼的頁面,只有當用戶輸入了正確的驗證碼時才能繼續正常的訪問服務。這樣的策略過于簡單,沒有針對搜索業務的場景進行優化,也沒有針對不同級別的用戶提供有針對性的服務內容,并且頻繁返回驗證碼頁面會導致用戶的體驗下降。
技術實現思路
鑒于如上至少一個問題,本專利技術提出了一種新的搜索控制方案。該控制方案能夠基于用戶的使用歷史對正常用戶進行分級,并且能夠在日常搜索場景中根據需要對不同級別的用戶返回不同的搜索結果內容。在系統發生災難時,能夠有選擇地保障高優用戶的搜索體驗。另外,本專利技術的搜索控制方案優化了各類服務器、存儲器和運營維護之間的關系,從而提升了搜索系統抗風險和防爬取的能力。根據本專利技術的一個方面,提出了一種搜索控制方法,包括:獲取與用戶請求相對應的用戶質量標簽,所述用戶質量標簽是根據用戶使用歷史得到的;以及至少基于所述用戶質量標簽給出與所述用戶請求相對應的搜索結果。這樣,能夠根據一個用戶的使用歷史對該用戶進行標記,并且根據該標記決定要返回給該用戶的搜索結果。優選地,用戶質量標簽可以是對離線日志中用戶的歷史使用記錄進行行為特征分析 ...
【技術保護點】
一種搜索控制方法,包括:獲取與用戶請求相對應的用戶質量標簽,所述用戶質量標簽是根據用戶使用歷史得到的;以及至少基于所述用戶質量標簽給出與所述用戶請求相對應的搜索結果。
【技術特征摘要】
1.一種搜索控制方法,包括:獲取與用戶請求相對應的用戶質量標簽,所述用戶質量標簽是根據用戶使用歷史得到的;以及至少基于所述用戶質量標簽給出與所述用戶請求相對應的搜索結果。2.如權利要求1所述的方法,其中,所述用戶質量標簽是對離線日志中用戶的歷史使用記錄進行行為特征分析得到的標簽。3.如權利要求1所述的方法,其中,所述用戶質量標簽是根據用戶使用歷史對用戶進行分級的標簽,并且至少基于所述用戶質量標簽給出與所述用戶請求相對應的搜索結果包括:給出與所述用戶請求相對應的、具有與所述用戶質量標簽相匹配的質量級別的搜索結果。4.如權利要求1所述的方法,其中,所述搜索結果包括具有不同質量級別的搜索結果,所述具有不同質量級別的搜索結果包括懲罰性搜索結果,所述懲罰性搜索結果包括要求輸入驗證碼或是拒絕搜索。5.如權利要求4所述的方法,還包括:根據所述用戶請求確定如下的至少一項:所述用戶位于白名單中,和發出所述用戶請求的應用不屬于搜索控制目標,以及基于如上確定的至少一項,避免對所述用戶請求給出懲罰性搜索結果。6.如權利要求4所述的方法,還包括:根據所述用戶請求確定如下的至少一項:所述用戶請求包括爬蟲標記,所述用戶位于黑名單中,和所述用戶未通過正常用戶驗證,以及基于如上確定的至少一項,對所述用戶請求給出懲罰性搜索結果。7.如權利要求1所述的方法,其中,基于所述用戶質量標簽和實時集群搜索狀態給出與所述用戶請求相對應的搜索結果。8.如權利要求7所述的方法,其中,在所述實時集群搜索狀態指示搜索服務故障或擁塞時,優先保證針對所述用戶質量標簽指示的高級別用戶給出的搜索結果的質量等級。9.如權利要求1所述的方法,其中,基于所述用戶質量標簽以及與所述用戶請求相關的預定周期內的搜索頻率給出與所述用戶請求相對應的搜索結果,并且與所述用戶請求相關的預定周期內的搜索頻率包括如下的至少一項:所述用戶的IP或cookie在預定周期內的搜索頻率;送入所述用戶請求的上層站點在預定周期內的搜...
【專利技術屬性】
技術研發人員:丁亦川,張強,張添翼,
申請(專利權)人:廣東神馬搜索科技有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。