【技術實現步驟摘要】
本專利技術屬于信息安全領域,具體地說,涉及一種信息安全性的處理方法和系統。
技術介紹
搜索引擎是一種廣泛應用的互聯網技術,其可以概述為運用一定的策略從互聯網上抓取網頁以收集信息,對收集到的信息提取關鍵詞并建立索引文件、去除重復網頁等處理后收錄到索引數據庫中,當用戶輸入檢索關鍵詞時候,搜索引擎從索引數據庫中找到匹配該檢索關鍵詞的網頁,即濾出與檢索關鍵詞有關的內容,并展現給用戶。目前,一些網站會篡改其他正常網站的頁面內容,把與其本身有關的關鍵詞埋放到其他正常網站頁面中,從而利用搜索引擎的上述機制使搜索引擎收錄埋放有所述關鍵詞的其他正常網站;還有一些釣魚網站主動將熱門關鍵詞埋放到自己的網站頁面,將自己偽裝成熱門搜索關鍵詞的相關網站,從而可以被搜索引擎收錄。當用戶在實際搜索時,搜索引擎會顯示與用戶輸入的關鍵詞匹配的結果,這其中可能就包括已被篡改過的正常網站,甚至包括偽裝的釣魚欺詐網站,顯然,這樣的搜索結果違背了用戶的搜索意圖,造成了大量的無效搜索結果,而且釣魚欺詐網站更是為搜索引擎的使用帶來極大的安全隱患。另外,對于上述被篡改過頁面內容的正常網站,還可能針對搜索引擎被做了跳轉處理,如果用戶直接點擊搜索引擎中相關的搜索結果,則可能會由被篡改過頁面內容的正常網站跳轉到其他網站,比如跳轉到釣魚欺詐網站。綜上,由于上述原因導致用戶無法獲知使用搜索引擎得到的搜索結果的有效性和安全性。
技術實現思路
本專利技術所要解決的技術問題是提供一種信息安全性的處理方法和系統,提高了搜索結果的有效性和安全性。為了解決上述技術問題,本專利技術提供了一種信息安全性的處理方法,包括根據搜索引擎中所使用的 ...
【技術保護點】
一種信息安全性的處理方法,包括:根據搜索引擎中所使用的檢索關鍵詞及其對應的搜索結果列表,分別在所述數據庫中進行匹配,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果;根據匹配結果識別所述搜索結果列表中存在的所述被利用的搜索結果;對所述搜索結果列表中存在的被利用的搜索結果進行安全性處理。
【技術特征摘要】
1.一種信息安全性的處理方法,包括 根據搜索引擎中所使用的檢索關鍵詞及其對應的搜索結果列表,分別在所述數據庫中進行匹配,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果; 根據匹配結果識別所述搜索結果列表中存在的所述被利用的搜索結果; 對所述搜索結果列表中存在的被利用的搜索結果進行安全性處理。2.根據權利要求I所述的方法,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果,進一步包括 收集所述預置關鍵詞、與所述預置關鍵詞對應的一個或多個搜索結果; 抓取每個搜索結果的網頁快照以及每個搜索結果的網址鏈接; 根據所述預置關鍵詞與所述網頁快照在文字內容進行一致性判斷,和/或根據所述預置關鍵詞與所述網址鏈接的類型進行一致性判斷,從而獲取所述搜索結果中存在的一個或多個被利用的搜索結果。3.根據權利要求I或2所述的方法,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果,進一步包括 收集所述預置關鍵詞對應的真實網頁網址、與所述預置關鍵詞對應的一個或多個搜索結果; 抓取每個搜索結果的網址鏈接; 根據所述真實網頁網址與所述網址鏈接的匹配關系來獲取所述搜索結果中存在的一個或多個被利用的搜索結果。4.根據權利要求1-3中任一項所述的方法,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果,進一步包括 收集所述預置關鍵詞對應的一個或多個搜索結果; 抓取每個搜索結果的網頁快照; 根據所述網頁快照以及所述搜索結果被訪問后開啟的頁面兩者在文字內容上的一致性來獲取所述搜索結果中存在的一個或多個被利用的搜索結果。5.根據權利要求1-4中任一項所述的方法,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果,進一步包括 收集所述預置關鍵詞、與所述預置關鍵詞對應的一個或多個搜索結果; 抓取每個搜索結果的網頁快照以及每個搜索結果的網址鏈接; 根據所述預置關鍵詞與所述網頁快照在文字內容上進行一致性判斷,和/或根據所述預置關鍵詞與所述網址鏈接的類型進行一致性判斷,從而初步確定所述搜索結果中存在的被利用的搜索結果,所述被利用的搜索結果包括顯示內容被篡改的搜索結果; 當初步確定所述被利用的搜索結果后,根據所述被利用的搜索結果的網頁快照以及所述被利用的搜索結果被訪問后開啟的頁面,兩者在文字內容上的一致性來最終獲取所述被利用的搜索結果,所述被利用的搜索結果包括顯示內容被篡改且訪問頁面發生跳轉的搜索結果。6.根據權利要求1-5中任一項所述的方法,其中,所述數據庫中預存預置關鍵詞及與所述預置關鍵詞對應的一個或多個被利用的搜索結果,進一步包括收集所述預置關鍵詞對應的真實網頁網址、與所述預置關鍵詞對應的一個或多個搜索結果; 抓取每個搜索結果中的網址鏈接; 根據所述真實網頁網址與所述網址鏈接的匹配關系來初步確定所述搜索結果中存在的被利用的搜索結果,所述被利用的搜索結果包括顯示內容被篡改的搜索結果; 當初步確定出所述被利用的搜索結果后,根據所述網頁快照以及所述搜索結果被訪問后開啟的頁面在文字內容上的一致性來最終獲取所述被利用的搜索結果,所述被利用的搜索結果包括顯示內容被篡改且訪問頁面發生跳轉的搜索結果。7.根據權利要求1-6中任一項所述的方法,其中,根據搜索引擎中所使用的檢索關鍵詞及其對應的搜索結果列表,分別在所述數據庫中進行匹配,進一步包括 根據所述檢索關鍵詞,與所述數據庫中預置關鍵詞進行匹配; 當所述檢索關鍵詞與所述預置關鍵詞匹配時,根據所述檢索關鍵詞對應的搜索結果列表,與所述數據庫中所述被利用的搜索結果進行匹配,以識別所述搜索結果列表中存在的被利用的搜索結果。8.根據權利要求1-7中任一項所述的方法,其中,根據搜索引擎中所使用的檢索關鍵詞及其對應的搜索結果列表,分別在所述數據庫中進行匹配,進一步包括 根據所述檢索關鍵詞對應的搜索結果列表,與所述數據庫中被利用的搜索結果進行匹配; 當所述搜索結果列表中匹配到所述被利用的搜索結果時,再根據所述檢索關鍵詞,與所述數據庫中所述預置關鍵詞進行匹配,以識別所述搜索結果列表中存在的被利用的搜索結果。9.根據權利要求1-8中任一項所述的方法,其中, 通過查詢接口獲取所述搜索引擎中所使用的檢索關鍵詞及其對應的搜索結果列表。10.根據權利要求1-9中任一項所述方法,其中,對存在危險的搜索結果進行安全性處理,進一步包括 在所述檢索關鍵詞對應搜索結果中,對包括所述被利用的搜索結果的搜...
【專利技術屬性】
技術研發人員:劉起,趙冠捷,錢軍,
申請(專利權)人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。