The invention discloses a domain knowledge map and a query method based on a semantic triangle. The invention of the map including concept layer and entity layer; the concept layer is composed of a collection of concepts, each concept with unique identifier, and represented by a lexical entry and candidate lexical entry sets; according to the domain concept knowledge and concept layer set, multiple entities corresponding to instantiate each concept, constitute the physical layer, the entity is the extension of a concept, a unique identifier for each entity, and represented by a lexical entry and candidate lexical entry sets; related to establish related knowledge according to the field set between the related concepts; concept layer and entity layer is provided with a relationship established according to relevant knowledge of related fields; according to the related field the construction of knowledge set between entities. The method realizes the separation of concepts and entities, facilitates the carding of knowledge, and distinguishes the different roles of concepts and entities in the understanding and application of knowledge, thus improving the query efficiency.
【技術實現步驟摘要】
一種基于語義三角的領域知識圖譜及查詢方法
本專利技術屬于人工智能領域,具體涉及一種基于語義三角的領域知識圖譜及查詢方法。
技術介紹
隨著互聯網技術的飛速發展,人類先后經歷了以文檔為主要特征的“Web1.0”時代和以數據互聯數據共享為特征的“Web2.0”時代,并且正在走向基于知識互聯的“Web3.0”時代。在大數據中表示一個可理解的知識網絡,成為現代互聯網時代的一大挑戰。同樣,人機交互的基礎在于理解用戶的言語信息、推斷用戶的意圖進而由機器返回給用戶結果。知識圖譜以其強大的語義處理能力與開放互聯的能力應運而生,能夠將互聯網中的海量、異構的數據聚集為可理解的知識網絡,便于理解、應用。因此,如何表示某個特定領域的知識圖譜并應用于特定的業務場景以解決相應的問題,具有十分重要的意義。現有的知識圖譜的表示大多描述的是實體之間的語義網絡,每個實體(概念的外延)用一個全局唯一確定的ID來標識,采用主-謂-賓三元組的形式表示知識網絡。但是這種表示方法會帶來概念和實體的混淆,從而造成用戶的理解障礙,并且不利于實體的理解。針對特定的問題,需要在存在海量數據和關系的知識圖譜中查詢,成本相對較高。傳統的知識圖譜還存在一詞多義和一義多詞的問題,使得語義網絡混亂,不利于從互聯網豐富的詞語中整理出知識并進行快速查詢。語義三角是一種關于意義的理論,由英國學者奧格登(Ogden)和理查茲(Richards)在1923年出版的語義學重要著作《意義的意義》(TheMeaningofMeaning)中提出,代表了傳統語義學的典型觀點。描述的是符號、概念(意義)和客觀事物之間的一種相互制約、相互作用 ...
【技術保護點】
一種基于語義三角的領域知識圖譜,其特征在于,包括概念層、實體層;其中,所述概念層為一與目標領域知識相關的概念集合,每一概念設有唯一的標識,并用一代表詞項和一候選詞項集合表示;所述概念對應語義三角中的概念或意義,概念i的所述候選詞項集合中的每個候選詞為該概念i的代表詞項的同義詞或近義詞,概念i對應的每一候選詞設置一代表概念i的概率值;所述實體層為一實體集合,根據目標領域相關的知識對所述概念集合中每個概念進行實例化得到每一概念對應的多個實體,構成所述實體集合;每一實體設有唯一的標識,并用一代表詞項和一候選詞項集合;實體i的所述候選詞項集合中的每個候選詞為該實體i的代表詞項的同義詞,實體i對應的每一候選詞設置一代表實體i的概率值;所述概念層的相關概念之間設置有根據領域相關知識建立的關聯關系;概念層與實體層之間設置有根據領域相關知識建立的關聯關系;所述實體之間設置有根據領域相關知識構建的關聯關系。
【技術特征摘要】
1.一種基于語義三角的領域知識圖譜,其特征在于,包括概念層、實體層;其中,所述概念層為一與目標領域知識相關的概念集合,每一概念設有唯一的標識,并用一代表詞項和一候選詞項集合表示;所述概念對應語義三角中的概念或意義,概念i的所述候選詞項集合中的每個候選詞為該概念i的代表詞項的同義詞或近義詞,概念i對應的每一候選詞設置一代表概念i的概率值;所述實體層為一實體集合,根據目標領域相關的知識對所述概念集合中每個概念進行實例化得到每一概念對應的多個實體,構成所述實體集合;每一實體設有唯一的標識,并用一代表詞項和一候選詞項集合;實體i的所述候選詞項集合中的每個候選詞為該實體i的代表詞項的同義詞,實體i對應的每一候選詞設置一代表實體i的概率值;所述概念層的相關概念之間設置有根據領域相關知識建立的關聯關系;概念層與實體層之間設置有根據領域相關知識建立的關聯關系;所述實體之間設置有根據領域相關知識構建的關聯關系。2.如權利要求1所述的領域知識圖譜,其特征在于,所述相關概念之間的關聯關系包括:a)包含關系,若概念及其屬性均在所述概念集合中,則概念與其屬性之間為包含關系;b)隸屬關系,若一個概念是另外一個概念涵義的子集,則兩者之間的關系即為隸屬關系。3.如權利要求1所述的領域知識圖譜,其特征在于,所述概念與所述實體之間、所述概念與所述概念的表示之間是緊密耦合關系,所述實體與所述實體的表示之間是松散耦合關系。4.如權利要求1或2或3所述的領域知識圖譜,其特征在于,所述概念層根據不同的業務場景分為若干概念子層,每一概念子層對應一概念子集。5...
【專利技術屬性】
技術研發人員:王宏安,李依霖,朱嘉奇,劉勝航,
申請(專利權)人:中國科學院軟件研究所,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。