本發(fā)明專利技術涉及人工智能技術領域,公開了一種語音信息提取方法、裝置、設備及存儲介質。該語音信息提取方法包括:獲取基于人機交互產生的音頻數(shù)據(jù),利用自動語音識別技術將所述音頻數(shù)據(jù)轉化為文本信息;基于信息提取模型對所述文本信息進行關鍵信息提取;根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫;調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息。通過上述方式,本發(fā)明專利技術能夠提高語音信息提取的準確率和糾偏效率,解決語音識別不準確的問題。不準確的問題。不準確的問題。
【技術實現(xiàn)步驟摘要】
語音信息提取方法、裝置、設備及存儲介質
[0001]本專利技術涉及人工智能
,特別是涉及一種語音信息提取方法、裝置、設備及存儲介質。
技術介紹
[0002]目前,在一些金融保險業(yè)務場景中,如車險,需要從通話中的語音信息提取一些關鍵信息,比如:客戶的姓名、手機號碼、地址、預約時間、車型、產品信息等,使用這些信息來減少坐席在系統(tǒng)中操作,從而提高操作效率。而語音系統(tǒng)中語音內容識別的精確性,是影響語音信息提取準確率的關鍵制約因素,但是由于技術限制,生成的文本可能包含錯誤,繼而導致后續(xù)的關鍵信息提取出現(xiàn)偏差,準確率低。
技術實現(xiàn)思路
[0003]本專利技術提供一種語音信息提取方法、裝置、設備及存儲介質,能夠提高語音信息提取的準確率和糾偏效率,解決語音識別不準確的問題。
[0004]為解決上述技術問題,本專利技術采用的一個技術方案是:提供一種語音信息提取方法,包括:
[0005]獲取基于人機交互產生的音頻數(shù)據(jù),利用自動語音識別技術將所述音頻數(shù)據(jù)轉化為文本信息;
[0006]基于信息提取模型對所述文本信息進行關鍵信息提取;
[0007]根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫;
[0008]調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息。
[0009]根據(jù)本專利技術的一個實施例,所述根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫還包括:
[0010]將所述業(yè)務類型與預設的糾偏庫進行匹配,判斷是否存在相匹配的糾偏庫;
[0011]若是,則將相匹配的預設的糾偏庫確定為所述目標糾偏庫;
[0012]若否,則根據(jù)所述業(yè)務類型創(chuàng)建新的調用接口以增加新的糾偏庫,將所述新的糾偏庫確定為所述目標糾偏庫。
[0013]根據(jù)本專利技術的一個實施例,所述調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息還包括:
[0014]調用所述目標糾偏庫對所述關鍵信息進行糾偏處理;
[0015]根據(jù)糾偏處理結果對所述關鍵信息進行標注處理;
[0016]根據(jù)標注處理結果獲得糾偏后的目標關鍵信息。
[0017]根據(jù)本專利技術的一個實施例,所述根據(jù)糾偏處理結果對所述關鍵信息進行標注處理還包括:
[0018]若所述糾偏處理結果為所述關鍵信息在所述目標糾偏庫中匹配到目標關鍵信息,則對所述關鍵信息標注第一標簽;
[0019]若所述糾偏處理結果為所述關鍵信息在所述目標糾偏庫中未匹配到目標關鍵信息,則將所述關鍵信息轉化為拼音信息,基于所述拼音信息和預設數(shù)據(jù)庫對所述關鍵信息進行重新糾偏處理,根據(jù)重新糾偏結果對所述關鍵信息進行標注處理。
[0020]根據(jù)本專利技術的一個實施例,所述基于信息提取模型對所述文本信息進行關鍵信息提取之后,還包括:
[0021]自動檢驗所提取的關鍵信息的格式是否預設格式要求;
[0022]若是,則執(zhí)行根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫的步驟;
[0023]若否,則舍棄所述關鍵信息。
[0024]根據(jù)本專利技術的一個實施例,所述利用自動語音識別技術將所述音頻數(shù)據(jù)轉化為文本信息包括:
[0025]利用自動語音識別技術對所述音頻數(shù)據(jù)進行聲紋識別,獲得至少一種聲音特征;
[0026]獲取各所述聲音特征在所述音頻數(shù)據(jù)中的語音時長以及聲音頻譜;
[0027]根據(jù)所述語音時長以及所述聲音頻譜從所述音頻數(shù)據(jù)中確定目標語音數(shù)據(jù),以對所述目標語音數(shù)據(jù)進行文本轉換,得到所述文本信息。
[0028]根據(jù)本專利技術的一個實施例,所述基于信息提取模型對所述文本信息進行關鍵信息提取包括:
[0029]通過詞嵌入層對所述文本信息進行向量化處理,獲取與所述文本信息對應的向量序列;
[0030]通過注意力機制層對所述向量序列進行特征提取,得到包含有上下文信息的特征向量;
[0031]通過池化層和卷積層對所述特征向量進行深層特征提取,得到關鍵信息以及對應的信息類型標簽。
[0032]為解決上述技術問題,本專利技術采用的另一個技術方案是:提供一種語音信息提取裝置,包括:
[0033]獲取模塊,用于獲取基于人機交互產生的音頻數(shù)據(jù),利用自動語音識別技術將所述音頻數(shù)據(jù)轉化為文本信息;
[0034]提取模塊,用于基于信息提取模型對所述文本信息進行關鍵信息提取;
[0035]匹配模塊,用于根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫;
[0036]糾偏模塊,用于調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息。
[0037]為解決上述技術問題,本專利技術采用的再一個技術方案是:提供一種計算機設備,包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)所述的語音信息提取方法。
[0038]為解決上述技術問題,本專利技術采用的再一個技術方案是:提供一種計算機存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述語音信息提取方法。
[0039]本專利技術的有益效果是:通過根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫,能夠減小數(shù)據(jù)處理量,提高糾偏效率;通過調用目標糾偏庫對關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息,能夠提高語音信息提取的準確率,解決語音識別不準確的問題。
附圖說明
[0040]圖1是本專利技術一實施例的語音信息提取方法的流程示意圖;
[0041]圖2是本專利技術實施例的語音信息提取方法中步驟S103的流程示意圖;
[0042]圖3是本專利技術實施例的語音信息提取方法中步驟S104的流程示意圖;
[0043]圖4是本專利技術實施例的語音信息提取裝置的結構示意圖;
[0044]圖5是本專利技術實施例的計算機設備的結構示意圖;
[0045]圖6是本專利技術實施例的計算機存儲介質的結構示意圖。
具體實施方式
[0046]下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅是本專利技術的一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。
[0047]本專利技術中的術語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特征的數(shù)量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隱含地包括至少一個該特征。本專利技術的描述中,“多個”的含義是至少兩個,例如兩個,三個等,除非另有明確具體的限定。本專利技術實施例中所有方向性指示(諸如上、下、左、右、前、后
……
)僅用于解釋在某一特定姿態(tài)(如附圖所示)下各部件之間的相對位置關系、運動情況等,如果該本文檔來自技高網(wǎng)...
【技術保護點】
【技術特征摘要】
1.一種語音信息提取方法,其特征在于,包括:獲取基于人機交互產生的音頻數(shù)據(jù),利用自動語音識別技術將所述音頻數(shù)據(jù)轉化為文本信息;基于信息提取模型對所述文本信息進行關鍵信息提取;根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫;調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息。2.根據(jù)權利要求1所述的語音信息提取方法,其特征在于,所述根據(jù)所述業(yè)務類型匹配預設的糾偏庫,獲得目標糾偏庫還包括:將所述業(yè)務類型與預設的糾偏庫進行匹配,判斷是否存在相匹配的糾偏庫;若是,則將相匹配的預設的糾偏庫確定為所述目標糾偏庫;若否,則根據(jù)所述業(yè)務類型創(chuàng)建新的調用接口以增加新的糾偏庫,將所述新的糾偏庫確定為所述目標糾偏庫。3.根據(jù)權利要求1所述的語音信息提取方法,其特征在于,所述調用所述目標糾偏庫對所述關鍵信息進行糾偏處理,得到糾偏后的目標關鍵信息還包括:調用所述目標糾偏庫對所述關鍵信息進行糾偏處理;根據(jù)糾偏處理結果對所述關鍵信息進行標注處理;根據(jù)標注處理結果獲得糾偏后的目標關鍵信息。4.根據(jù)權利要求3所述的語音信息提取方法,其特征在于,所述根據(jù)糾偏處理結果對所述關鍵信息進行標注處理還包括:若所述糾偏處理結果為所述關鍵信息在所述目標糾偏庫中匹配到目標關鍵信息,則對所述關鍵信息標注第一標簽;若所述糾偏處理結果為所述關鍵信息在所述目標糾偏庫中未匹配到目標關鍵信息,則將所述關鍵信息轉化為拼音信息,基于所述拼音信息和預設數(shù)據(jù)庫對所述關鍵信息進行重新糾偏處理,根據(jù)重新糾偏結果對所述關鍵信息進行標注處理。5.根據(jù)權利要求1所述的語音信息提取方法,其特征在于,所述基于信息提取模型對所述文本信息進行關鍵信息提取之后,還包括:自動檢驗所提取的關鍵信息的格式是否預設格式要求;若是,則執(zhí)行根據(jù)所提取的關鍵信息確定業(yè)務類型,根據(jù)所述業(yè)務...
【專利技術屬性】
技術研發(fā)人員:姜衛(wèi)宏,
申請(專利權)人:中國平安財產保險股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。