【技術實現步驟摘要】
本專利技術涉及分布式向量,尤其涉及一種基于分布式向量數據庫的相似事件識別方法、服務端、客戶端及基于分布式向量數據庫的相似事件識別系統。
技術介紹
1、隨著信息技術的發展,在城市治理、應急調度等領域下,積累了大量的業務事件,如何在海量的事件中快速的發現形同或相似的事件,從而減少事件的重復處理提高事件的響應速度,成為比較迫切的需求。
技術實現思路
1、本專利技術提供了一種基于分布式向量數據庫的相似事件識別方法、服務端、客戶端及基于分布式向量數據庫的相似事件識別系統,解決相關技術中存在的海量事件響應速度低的問題。
2、作為本專利技術的第一個方面,提供一種基于分布式向量數據庫的相似事件識別方法,其中,包括:
3、獲取客戶端的當前事件序列信息,其中所述客戶端能夠將接收到的當前上報事件進行序列化處理后獲得當前事件序列信息,其中所述當前上報事件至少包括當前事件描述信息和當前事件標題信息;
4、將所述當前事件序列信息輸入至語言識別模型,獲得相似向量識別結果,其中所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,以及能夠將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,其中所述向量數據庫包括根據語料庫中的語料事件信息向量化處理后獲得的語料事件向量信息;
5、將所述相似向量識別結果進行存儲,并當接收到客戶端的查詢指令時向客戶端返回相似向量識別結果。
6、進一步地,所述語言識別模型能夠對所述當前事件序列信
7、將所述當前事件序列信息進行文本向量化處理,獲得當前事件序列信息的向量化表示結果;
8、對當前事件序列信息的向量化表示結果進行向量信息抽取,獲得當前事件向量信息。
9、進一步地,所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,包括:
10、將所述當前事件序列信息進行文本向量化處理,獲得當前事件序列信息的向量化表示結果;
11、對當前事件序列信息的向量化表示結果進行向量信息抽取,獲得當前事件向量信息。
12、進一步地,將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,包括:
13、將所述當前事件向量信息與向量數據庫內的語料事件向量信息進行向量相似度計算,獲得向量相似度計算結果;
14、將所述向量相似度計算結果與預設相似度閾值進行比較,并將大于預設相似度閾值的向量相似度計算結果作為相似向量識別結果。
15、進一步地,所述基于分布式向量數據庫的相似事件識別方法還包括:
16、根據語料庫構建向量數據庫;
17、創建向量數據庫索引。
18、進一步地,所述創建向量數據庫索引包括:
19、實時獲取清洗過的語料庫;
20、根據預設間隔定時讀取語料庫數據,以判斷是否存在更新;
21、若存在更新,則根據語言識別模型在語料庫這種抽取語義向量;
22、將抽取完成的寓意向量更新至向量數據庫,并更新向量數據庫中的id信息以及事件分類信息。
23、進一步地,所述基于分布式向量數據庫的相似事件識別方法還包括:
24、接收客戶端的查詢指令;
25、根據所述查詢指令提取待查詢相似事件;
26、根據所述待查詢相似事件在所述向量數據庫中進行查詢,以確定查詢id信息;
27、根據所述查詢id信息查詢相似向量識別結果,以向客戶端返回相似向量識別結果。
28、作為本專利技術的另一個方面,提供一種基于分布式向量數據庫的相似事件識別方法,其中,包括:
29、接收當前上報事件以及語料庫中的語料事件信息,其中所述當前上報事件至少包括當前事件描述信息和當前事件標題信息,所述語料事件信息至少包括語料事件描述信息和語料事件標題信息;
30、分別對所述當前上報事件以及語料事件信息進行序列化處理,獲得當前事件序列信息以及語料事件序列信息;
31、將所述當前事件序列信息以及語料事件序列信息發送至服務端,所述服務端能夠將當前事件序列信息輸入至語言識別模型,以獲得相似向量識別結果,其中所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,以及能夠將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,其中所述向量數據庫包括根據語料庫中的語料事件信息向量化處理后獲得的語料事件向量信息;
32、接收服務端返回的相似向量識別結果。
33、作為本專利技術的另一個方面,提供一種服務端,用于實現前文所述的基于分布式向量數據庫的相似事件識別方法,其中,包括:
34、獲取模塊,用于獲取客戶端的當前事件序列信息,其中所述客戶端能夠將接收到的當前上報事件進行序列化處理后獲得當前事件序列信息,其中所述當前上報事件至少包括當前事件描述信息和當前事件標題信息;
35、識別模塊,用于將所述當前事件序列信息輸入至語言識別模型,獲得相似向量識別結果,其中所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,以及能夠將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,其中所述向量數據庫包括根據語料庫中的語料事件信息向量化處理后獲得的語料事件向量信息;
36、存儲與返回模塊,用于將所述相似向量識別結果進行存儲,并當接收到客戶端的查詢指令時向客戶端返回相似向量識別結果。
37、作為本專利技術的另一個方面,提供一種客戶端,用于實現前文所述的基于分布式向量數據庫的相似事件識別方法,其中,包括:
38、第一接收模塊,用于接收當前上報事件以及語料庫中的語料事件信息,其中所述當前上報事件至少包括當前事件描述信息和當前事件標題信息,所述語料事件信息至少包括語料事件描述信息和語料事件標題信息;
39、序列化處理模塊,用于分別對所述當前上報事件以及語料事件信息進行序列化處理,獲得當前事件序列信息以及語料事件序列信息;
40、發送模塊,用于將所述當前事件序列信息以及語料事件序列信息發送至服務端,所述服務端能夠將當前事件序列信息輸入至語言識別模型,以獲得相似向量識別結果,其中所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,以及能夠將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,其中所述向量數據庫包括根據語料庫中的語料事件信息向量化處理后獲得的語料事件向量信息;
41、第二接收模塊,用于接收服務端返回的相似向量識別結果。
42、作為本專利技術的另一個方面,提供一種基于分布式向量數據庫的相似事件識別系統,其中,包括:前文所述的服務端和前文所述的客戶端,所述服務端與所述客戶端通信連接。
43、本專利技術提供的基于分布式向量數據庫的相似事件識別方法,通過獲取當前事本文檔來自技高網...
【技術保護點】
1.一種基于分布式向量數據庫的相似事件識別方法,其特征在于,包括:
2.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,包括:
3.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,包括:
4.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述基于分布式向量數據庫的相似事件識別方法還包括:
5.根據權利要求4所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述創建向量數據庫索引包括:
6.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述基于分布式向量數據庫的相似事件識別方法還包括:
7.一種基于分布式向量數據庫的相似事件識別方法,其特征在于,包括:
8.一種服務端,用于實現權利要求1至6中任意一項所述的基于分布式向量數據庫的相似事件識別方法,其特征在于
9.一種客戶端,用于實現權利要求7所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,包括:
10.一種基于分布式向量數據庫的相似事件識別系統,其特征在于,包括:權利要求8所述的服務端和權利要求9所述的客戶端,所述服務端與所述客戶端通信連接。
...【技術特征摘要】
1.一種基于分布式向量數據庫的相似事件識別方法,其特征在于,包括:
2.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述語言識別模型能夠對所述當前事件序列信息進行向量信息抽取以獲得當前事件向量信息,包括:
3.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,將所述當前事件向量信息代入向量數據庫獲得相似向量識別結果,包括:
4.根據權利要求1所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述基于分布式向量數據庫的相似事件識別方法還包括:
5.根據權利要求4所述的基于分布式向量數據庫的相似事件識別方法,其特征在于,所述創建向...
【專利技術屬性】
技術研發人員:王峰,顧毅,熊亮,梁新樂,
申請(專利權)人:無錫雪浪數制科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。