本發明專利技術公開了一種搜索服務器,該服務器包括信息安全度存儲器和搜索后處理器,信息安全度存儲器適于存儲一個或者多個網頁的信息安全度信息,至少包括網頁的URL和該網頁的信息安全度;搜索后處理器根據該搜索結果列表的每個搜索結果項中網頁的URL從信息安全度存儲器獲取相應網頁的信息安全度信息,根據網頁的排序得分和信息安全度生成網頁的新排序得分,并以新排序得分更新搜索結果列表中的相應搜索結果項中的排序得分以重新排序生成新搜索結果列表。本發明專利技術還公開了一種相應的搜索方法。
【技術實現步驟摘要】
本專利技術涉及網絡搜索領域,尤其涉及一種考慮到網絡內容的信息安全度的搜索服務器及相應的搜索方法。
技術介紹
隨著互聯網的高速發展,各種企業、組織和個人等逐步了解到在互聯網上提供信息服務的重要性而紛紛建立各自的網站來發布相應信息。隨著在網絡上提供網絡信息服務的網站日益增多,互聯網用戶很難記住所有的這些網站甚至是想訪問的網站的具體地址。 與此同時,互聯網所容納的信息也在呈爆炸式增長,發展到今天,互聯網上的各種內容,可謂是浩如煙海。在這種情況下,如何讓互聯網用戶在最短的時間內找到自己想要的內容成為了當務之急。于是,有別于開始的發布各種消息的網站,一類專事搜索的網站、服務器應運而生。而基于互聯網的搜索網站以及衍生出的各種搜索方式,也極大的推動了互聯網的發展。目前,互聯網用戶在很大程度上都依賴于搜索網站來查詢這些自己需要的內容。一般而言,搜索網站利用搜索引擎來從互聯網中提取各個網站的信息(以網頁文字為主),建立起數據庫。當用戶在搜索網站上進行查詢時,搜索引擎能檢索與用戶查詢條件相匹配的記錄。按照搜索結果與查詢條件相匹配的程度,給出搜索結果中每條相應記錄的排名得分score,按照排名得分score的高低來排序并返回給用戶。然而,隨著互聯網的快速發展,互聯網上的信息呈爆炸式增長,各種不良和不正確的信息也越來越多。用戶通過搜索網站進行查詢時,經常會獲得不正確、錯誤和惡意的信息。一些惡意人員故意構造帶有木馬、病毒等網頁,利用搜索引擎的排名算法缺陷,使這些惡意網頁在搜索結果中排名靠前。用戶一旦通過搜索引擎搜索到這樣的網頁并選擇瀏覽這些惡意網頁,則很可能會因此使得用戶的終端感染木馬或者中毒并因此造成損失。另外一些惡意人員會構造類似于真實網站的虛假網站,并且利用搜索引擎的缺陷而在用戶進行搜索時,在搜索結果中將虛假網站排名在真實網站之前,這樣很可能引導用戶前往這些虛假網站而使用戶被虛假網站誤導而遭受損失。現有一些搜索引擎會在搜索結果中提醒用戶相應的網頁可能包含諸如木馬、病毒的惡意內容,從而可以阻止用戶訪問這些網頁。然而,現有的搜索引擎僅僅對惡意內容進行甄別,而沒有對包含虛假內容的網頁進行甄別,不能滿足用戶的真實需求。因此,用戶如何通過搜索引擎獲得準確和安全的信息成為目前的重要挑戰。
技術實現思路
鑒于上述問題,提出了本專利技術以便提供一種克服上述問題或者至少部分地解決上述問題的搜索服務器和相應的搜索方法。根據本專利技術的一個方面,提供了一種搜索服務器,該搜索服務器包括信息存儲器、 搜索處理器、信息安全度存儲器和搜索后處理器。信息存儲器,適于存儲從接入互聯網的各網站中收集的網頁信息,其中網頁信息至少包括網頁的內容及其URL。搜索處理器,適于接收從用戶終端提交的搜索關鍵詞,從信息存儲器中檢索內容包括搜索關鍵詞的各個網頁, 并生成包括一個或者多個搜索結果項的搜索結果列表,其中每個搜索結果項包括相應網頁的URL及其排序得分R_SCOre。信息安全度存儲器,適于存儲一個或者多個網頁的信息安全度信息,每個網頁的信息安全度信息至少包括網頁的URL和網頁的信息安全度IS_sCOre。 搜索后處理器,適于從搜索處理器獲取搜索結果列表,根據搜索結果列表的每個搜索結果項中網頁的URL從信息安全度存儲器獲取相應網頁的信息安全度信息,根據網頁的排序得分R_score和信息安全度IS_score生成網頁的新排序得分NR_score,并以新排序得分NR_ score更新搜索結果列表中的相應搜索結果項中的排序得分R_score以重新排序生成新搜索結果列表。可選地,在根據本專利技術的搜索服務器中,根據下述來計算新排序得分NR_score=IS_score*x+R_score* (1-χ),其中X是信息安全度權重,在0-1之間,優選為O. 7。可選地,在根據本專利技術的搜索服務器中,其中當所獲取的信息安全度IS_sCOre小于一特定值時,所述搜索后處理器自動從搜索結果列表中刪除與所述信息安全度is_score 對應的網頁的搜索結果項。特別地,如果本專利技術所述的信息安全度IS_SCOre取值在1-100 之間,當上述所獲取的信息安全度IS_sC0re小于30時,所述搜索后處理器自動從搜索結果列表中刪除與所述信息安全度IS_sC0re對應的網頁的搜索結果項。可選地,在根據本專利技術的搜索服務器中,新搜索結果列表的搜索結果項還包括相應網頁的信息安全度IS_score。可選地,在根據本專利技術的搜索服務器中,如果當搜索后處理器未能從信息安全度存儲器獲得相應網頁的信息安全度信息,則搜索后處理器不計算所述網頁的新排序得分 NR_score且不更新搜索結果列表中的相應搜索結果項中的排序得分R_score。可選地,根據本專利技術的搜索服務器還包括結果處理器,其適于從搜索后處理器獲取新搜索結果列表,生成搜索結果并呈現給用戶終端;可選地,呈現給用戶終端的搜索結果包括相應網頁的信息安全度。根據本專利技術的另一個方面,還提供一種相應的搜索方法,在包括信息存儲器和信息安全度存儲器的搜索服務器中運行,信息存儲器適于存儲從接入互聯網的各網站中收集的網頁信息,網頁信息至少包括網頁的內容及其URL,信息安全度存儲器適于存儲一個或者多個網頁的信息安全度信息,每個網頁的信息安全度信息至少包括網頁的URL和網頁的信息安全度IS_score。該搜索方法包括如下步驟接收從用戶終端提交的搜索關鍵詞;從信息存儲器中檢索內容中含有搜索關鍵詞的各個網頁,并生成包括一個或者多個搜索結果項的搜索結果列表,每個搜索結果項包括相應網頁的URL及其排序得分R_score ;根據搜索結果列表的每個搜索結果項中網頁的URL從信息安全度存儲器獲取相應網頁的信息安全度信息,并根據網頁的排序得*R_score和信息安全度IS_score生成網頁的新排序得分NR_score,并以新排序得分NR_score來更新搜索結果列表中的相應搜索結果項中的排序得分R_score以重新排序生成新搜索結果列表。根據本專利技術的搜索服務器和搜索方法,為用戶搜索并顯示了表征相應網頁內容安全且準確的信息安全度,使得用戶能夠直接得到更安全、更準確的搜索結果。上述說明僅是本專利技術技術方案的概述,為了能夠更清楚了解本專利技術的技術手段, 而可依照說明書的內容予以實施。附圖說明通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出具體實施方式的目的,而并不認為是對本專利技術的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中圖I為根據本專利技術一個實施例而提供的搜索服務器的結構示意圖。圖2為根據本專利技術一個實施例而提供的搜索方法的流程圖。具體實施方式本專利技術提供了一種為網絡搜索結果提供信息安全度的搜索服務器和搜索方法,下面將結合附圖詳細說明如下。參見圖1,根據本專利技術一個實施例的搜索服務器包括信息收集/處理器100,信息存儲器101,信息安全度存儲器110,信息安全度處理器111,搜索處理器120,以及搜索后處理器121。用戶通過用戶終端140輸入搜索關鍵詞,經由本專利技術的搜索服務器,搜索并得到帶有網頁信息安全度的搜索結果,并通過用戶終端140呈現給用戶。在本專利技術中,用戶終端可以是計算機終端,也可以是手機、能接入互聯網的各種電子設備等。信息收集/處本文檔來自技高網...
【技術保護點】
一種搜索服務器,包括信息存儲器,適于存儲從接入互聯網的各網站中收集的網頁信息,所述網頁信息至少包括網頁的內容及其URL;搜索處理器,適于接收從用戶終端提交的搜索關鍵詞,從所述信息存儲器中檢索內容包括搜索關鍵詞的各個網頁,并生成包括一個或者多個搜索結果項的搜索結果列表,每個搜索結果項包括相應網頁的URL及其排序得分R_score;信息安全度存儲器,適于存儲一個或者多個網頁的信息安全度信息,每個網頁的信息安全度信息至少包括網頁的URL和所述網頁的信息安全度IS_score;搜索后處理器,適于從搜索處理器獲取所述搜索結果列表,根據所述搜索結果列表的每個搜索結果項中網頁的URL從信息安全度存儲器獲取相應網頁的信息安全度信息,根據所述網頁的排序得分R_score和信息安全度IS_score生成所述網頁的新排序得分NR_score,并以所述新排序得分NR_score更新所述搜索結果列表中的相應搜索結果項中的排序得分R_score以重新排序生成新搜索結果列表。
【技術特征摘要】
【專利技術屬性】
技術研發人員:張棟,
申請(專利權)人:北京奇虎科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。