"/>
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    實體關系抽取方法技術

    技術編號:39659250 閱讀:23 留言:0更新日期:2023-12-09 11:28
    本申請涉及一種實體關系抽取方法

    【技術實現步驟摘要】
    實體關系抽取方法、裝置、終端及存儲介質


    [0001]本申請涉及自然語言處理領域,尤其是涉及一種利用全局指針網絡增強的實體關系抽取方法

    裝置

    終端及存儲介質


    技術介紹

    [0002]在自然語言處理
    (Natural Language Processing,NLP)
    領域中,實體關系抽取是一項關鍵任務,旨在從非結構化文本中抽取出具有特定語義關系的實體對

    實體關系抽取在許多場景中都具有重要的應用價值,如信息提取

    問題回答

    知識圖譜構建等

    [0003]以往的實體關系抽取方案通常只關注于頭實體

    尾實體和實體關系這三個要素,抽取結果的表現形式也多為一個關系三元組
    (
    頭實體

    關系

    尾實體
    )
    ,就抽取結果本身而言,其完全忽略了實體的類型信息

    但是在后續的應用場景中,實體的類型信息可以在理解實體關系時發揮巨大的作用,因此上述傳統的實體關系抽取方案在結果的完整性方面都有待提高

    [0004]因此,如何提出一種全新的實體關系抽取方案,在實體關系抽取的過程中實現對實體類型的細致處理,提高實體關系抽取的準確性和可解釋性,也就成為了本領域內技術人員亟待解決的問題


    技術實現思路

    [0005]為了改進現有的實體關系抽取方案,本申請提供了一種實體關系抽取方法

    裝置

    終端及存儲介質

    本申請的方案充分利用了全局指針網絡,實現了實體關系抽取過程中對于實體類型的細致處理,提高了實體關系抽取的準確性和可解釋性

    [0006]第一方面,本申請提供了一種實體關系抽取方法,采用如下所述的技術方案

    [0007]一種實體關系抽取方法,包括如下步驟:
    [0008]對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果;
    [0009]依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型;
    [0010]對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系;
    [0011]對所述頭實體的首尾位置

    所述頭實體類型

    所述頭尾實體之間的關系

    所述尾實體的首尾位置

    所述尾實體類型進行信息匯總

    形成實體關系抽取結果并將其作為針對所述文本信息的輸出

    [0012]通過采用上述技術方案,利用全局指針網絡的技術架構,有效地捕獲并利用頭

    尾實體類型去增強實體關系抽取過程中地全局信息

    相較于現有方案中局部上下文的實體關系抽取,全局指針網絡能夠更準確地識別頭實體

    尾實體,并在全局范圍內完成實體對齊,
    最大限度地保證了實體關系抽取結果的精度

    [0013]此外,上述技術方案與現有的標注工具具有較高的適配性,所輸出的實體關系抽取結果可以直接導入至標注工具中,為專業人士后續的審核和修訂提供了便利,進一步提高了實體關系抽取的效率和可用性

    [0014]優選地,所述對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果,具體包括如下步驟:
    [0015]獲取文本信息,對所述文本信息進行序列化處理并在文本的首尾分別添加相對應的標記

    得到文本序列;
    [0016]將所述文本序列輸入經過預訓練的編碼模型中

    將所述編碼模型的輸出作為文本編碼結果,所述標記與所述編碼模型相適配,所述編碼模型為
    BERT
    ?
    Encoder
    模型

    [0017]通過采用上述技術方案,進一步明確了方法中文本編碼結果的生成過程,為方法后續的各項處理提供了基礎的技術支持

    [0018]優選地,所述依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型,具體包括如下步驟:
    [0019]依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,所述頭實體跨度中包含有頭實體的開始索引及結束索引,所述尾實體跨度中包含有尾實體的開始索引及結束索引;
    [0020]依據所述頭實體的開始索引及結束索引,分別得到頭實體的開始位置與頭實體的結束位置,依據所述頭實體的開始位置及所述頭實體的結束位置,計算得到所述頭實體作為特定頭實體類型的得分并據此確定所述頭實體對應的頭實體類型;
    [0021]依據所述尾實體的開始索引及結束索引,分別得到尾實體的開始位置與頭實體的結束位置,依據所述尾實體的開始位置及所述尾實體的結束位置,計算得到所述尾實體作為特定尾實體類型的得分并據此確定所述尾實體對應的尾實體類型

    [0022]通過采用上述技術方案,實現了在頭實體

    尾實體抽取過程中對于實體類型信息的兼顧,其中的頭實體預測及尾實體預測過程可以針對特定的實體類型進行精確識別,增強了方法整體對于實體的判別能力,降低了誤抽取的風險

    [0023]優選地,所述對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系,具體包括如下步驟:
    [0024]依據所述頭實體的開始位置及所述尾實體的開始位置,計算得到特定關系下所述頭實體與所述尾實體二者開始索引的匹配得分并將其作為第一對齊匹配結果;
    [0025]依據所述頭實體的結束位置及所述尾實體的結束位置,計算得到特定關系下所述頭實體與所述尾實體二者結束索引的匹配得分并將其作為第二對齊匹配結果;
    [0026]綜合所述第一對齊匹配結果及所述第二對齊匹配結果,完成所述頭實體與所述尾實體之間的關系對齊,確定與所述頭實體及所述尾實體相對應的所述頭尾實體之間的關系

    [0027]通過采用上述技術方案,快速且準確的獲知了頭實體與尾實體之間的關聯并預測了二者間的關系,其中對于頭實體與尾實體二者語義關聯的考慮,使得基于本方法的裝置
    或模本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.
    一種實體關系抽取方法,其特征在于,包括如下步驟:對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果;依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型;對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系;對所述頭實體的首尾位置

    所述頭實體類型

    所述頭尾實體之間的關系

    所述尾實體的首尾位置

    所述尾實體類型進行信息匯總

    形成實體關系抽取結果并將其作為針對所述文本信息的輸出
    。2.
    根據權利要求1所述的實體關系抽取方法,其特征在于,所述對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果,具體包括如下步驟:獲取文本信息,對所述文本信息進行序列化處理并在文本的首尾分別添加相對應的標記

    得到文本序列;將所述文本序列輸入經過預訓練的編碼模型中

    將所述編碼模型的輸出作為文本編碼結果,所述標記與所述編碼模型相適配,所述編碼模型為
    BERT
    ?
    Encoder
    模型
    。3.
    根據權利要求2所述的實體關系抽取方法,其特征在于,所述依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型,具體包括如下步驟:依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,所述頭實體跨度中包含有頭實體的開始索引及結束索引,所述尾實體跨度中包含有尾實體的開始索引及結束索引;依據所述頭實體的開始索引及結束索引,分別得到頭實體的開始位置與頭實體的結束位置,依據所述頭實體的開始位置及所述頭實體的結束位置,計算得到所述頭實體作為特定頭實體類型的得分并據此確定所述頭實體對應的頭實體類型;依據所述尾實體的開始索引及結束索引,分別得到尾實體的開始位置與頭實體的結束位置,依據所述尾實體的開始位置及所述尾實體的結束位置,計算得到所述尾實體作為特定尾實體類型的得分并據此確定所述尾實體對應的尾實體類型
    。4.
    根據權利要求3所述的實體關系抽取方法,其特征在于,所述對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系,具體包括如下步驟:依據所述頭實體的開始位置及所述尾實體的開始位置,計算得到特定關系下所述頭實體與所述尾實體二者開始索引的匹配得分并將其作為第一對齊匹配結果;依據所述頭實體的結束位置及所述尾實體的結束位置,計算得到特定關系下所述頭實體與所述尾實體二者結束索引的匹配得分并將其作為第二對齊匹配結果;綜合所述第一對齊匹配結果及所述第二對齊匹配結果,完成所述頭...

    【專利技術屬性】
    技術研發人員:龍如山劉志遠吳俁馬學中胡德斌
    申請(專利權)人:蘇州維眾數據技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 丰满亚洲大尺度无码无码专线 | 无码人妻一区二区三区免费n鬼沢 无码人妻一区二区三区免费看 | 国产产无码乱码精品久久鸭 | 亚洲AV永久无码精品| 无码视频一区二区三区| 伊人久久无码精品中文字幕| 亚洲精品无码专区在线在线播放| 亚洲AV日韩AV永久无码久久| 无码精品不卡一区二区三区| 中文无码喷潮在线播放| 午夜无码国产理论在线| 精品乱码一区内射人妻无码| 无码国产精品一区二区免费式芒果| 亚洲av无码一区二区三区人妖| 久久影院午夜理论片无码| 无码国产精品一区二区免费| 国产亚洲?V无码?V男人的天堂 | 白嫩少妇激情无码| 亚洲精品无码久久一线| 嫩草影院无码av| 亚洲精品无码成人| 国产在线精品无码二区| 日韩综合无码一区二区| 无码人妻精品中文字幕免费东京热| 一本大道东京热无码一区| 亚洲另类无码专区首页| 少妇人妻偷人精品无码视频新浪| 无码av大香线蕉伊人久久| 无码精品国产dvd在线观看9久| 东京热无码av一区二区| 国产免费av片在线无码免费看| 中文无码字慕在线观看| 久久男人Av资源网站无码软件| 亚洲成AV人在线观看天堂无码| 无码专区6080yy国产电影| 成年男人裸j照无遮挡无码| 久久久g0g0午夜无码精品| 亚洲国产精品无码中文lv| 无码国产精品一区二区免费 | 亚洲VA成无码人在线观看天堂| 无码国产成人午夜电影在线观看|