• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    聲紋相似度計算方法、系統、計算機設備和存儲介質技術方案

    技術編號:42622643 閱讀:28 留言:0更新日期:2024-09-06 01:26
    本發明專利技術公開了一種聲紋相似度計算方法、系統、計算機設備和存儲介質,其中,聲紋相似度計算方法包括以下步驟:在學習模型的訓練過程中輸入語音訓練數據,并采用對比學習的方式構造所述學習模型的數據集;根據所述數據集構造損失函數,根據所述損失函數訓練所述學習模型,直至所述學習模型收斂,得到對所述學習模型訓練完畢后的特征提取模型;對語音生產數據進行優質片段采集得到聲音段落集合;采用所述特征提取模型對所述聲音段落集合進行特征提取得到特征表達;對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果。本發明專利技術模型訓練過程簡單、泛化能力好,且聲紋相似度計算效果好,效率高。

    【技術實現步驟摘要】

    本專利技術涉及音頻識別,具體涉及一種聲紋相似度計算方法、系統、計算機設備和存儲介質


    技術介紹

    1、在金融服務場景中存在大量面向個人的電話客服場景,覆蓋了營銷、服務、客訴各個環節,這給不法分子留下可乘之機,不法分子通過假冒身份辦理服務或代理惡意客訴等手段,發展出一系列灰色產業。一般存在以下兩種情況:第一種是同用戶id數次通話聲音不同,例如用戶委托職業代理做惡意客訴;第二種是不同用戶id的通話聲音相同,例如假冒他人身份多次申請貸款。由于在電話中難以核實用戶真實身份,聲紋相似度計算技術成為最直接的技術防御手段,聲紋相似度計算系統需要對上述兩種情況都能做出準確的判斷,并在企業運營過程中及時告警。

    2、現有的聲紋相似度計算方法一般首先通過訓練學習模型,作為語音片段的特征提取器,然后在實際使用場景中,語音片段用訓練完畢的學習模型進行特征提取存入數據庫中,以便于后續對比,當有新的語音片段時,用特征提取器提取特征,再與數據庫中的歷史語音片段的特征進行比對,輸出相似度結果。然而現有的學習模型訓練方法普遍采用監督學習的方法,即使用帶有標簽的語音訓練數據進行模型訓練,這種訓練過程繁瑣,對語音訓練數據的要求高,同時訓練時的查準率和查全率不平衡,同時現有的損失函數使聲紋相似度計算模型難以收斂,或者泛化能力差,最終導致模型識別效果差,識別效率低。


    技術實現思路

    1、為了解決上述
    技術介紹
    中提到的至少一個問題,本專利技術提供了一種聲紋相似度計算方法、系統、計算機設備和存儲介質,模型訓練過程簡單、泛化能力好,且聲紋相似度計算效果好,效率高。

    2、本專利技術提供的具體技術方案如下:

    3、第一方面,提供一種聲紋相似度計算方法,包括以下步驟:

    4、在學習模型的訓練過程中輸入語音訓練數據,并采用對比學習的方式構造所述學習模型的數據集;

    5、根據所述數據集構造損失函數,根據所述損失函數訓練所述學習模型,直至所述學習模型收斂,得到對所述學習模型訓練完畢后的特征提取模型;

    6、對語音生產數據進行優質片段采集得到聲音段落集合;

    7、采用所述特征提取模型對所述聲音段落集合進行特征提取得到特征表達;

    8、對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果。

    9、作為上述方案的一種優選,所述采用對比學習的方式構造所述學習模型的數據集包括:

    10、將所述語音訓練數據中的每個數據經過不同時間節點的隨機采樣和隨機增強生成兩個子樣本;

    11、將所有所述子樣本輸入所述學習模型,得到所述子樣本的訓練特征值;

    12、根據所述訓練特征值得到所有所述子樣本的自相關表達矩陣,所述自相關表達矩陣中來自同個所述數據的所述子樣本互為正樣本,反之則互為負樣本。

    13、作為上述方案的一種優選,所述損失函數的公式為:

    14、

    15、其中,vi表示第i個所述子樣本的訓練特征值,vpair表示與vi同個所述數據來源的另一個所述子樣本的訓練特征值,vj表示第j個所述子樣本的訓練特征值,k表示所述語音訓練數據中所述數據的數量,2k表示所有所述子樣本的數量,τ表示訓練溫度系數。

    16、作為上述方案的一種優選,所述對語音生產數據進行優質片段采集得到聲音段落集合包括:

    17、對所述語音生產數據先剔除非人聲片段再剔除過短片段得到有效段落集合;

    18、對所述有效段落集合剔除低質量片段得到所述聲音段落集合。

    19、作為上述方案的一種優選,對所述語音生產數據先剔除非人聲片段再剔除過短片段得到有效段落集合中的所述剔除非人聲片段包括:

    20、剔除持續在預設時間以上且在第一預設閾值以下的聲音片段。

    21、作為上述方案的一種優選,所述對所述有效段落集合剔除低質量片段得到所述聲音段落集合包括:

    22、對所述有效段落集合中的每個段落剔除在第二預設閾值以下的聲音片段得到包含所述每個段落的子段落的集合;

    23、利用公式:每個段落的質量分=每個段落的子段落的數量*子段落中的段落最大長度,

    24、計算出所述每個段落的質量分,對所述有效段落集合中的段落按照質量分排序后取靠前若干段落,得到所述聲音段落集合。

    25、作為上述方案的一種優選,所述對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果包括:

    26、對不同組所述語音生產數據的所述特征表達進行余弦相似度計算,得到相似度矩陣;

    27、設置相似度閾值,將所述相似度矩陣中大于或等于所述相似度閾值的元素值置為1,反之則置為0,得到投票矩陣;

    28、設置投票比例閾值,若所述投票矩陣中值為1的元素比例大于或等于所述投票比例閾值,則所述相似度結果為相似,反之所述相似度結果為不相似。

    29、第二方面,提供一種聲紋相似度計算系統,包括:

    30、數據集構造模塊:用于在學習模型的訓練過程中輸入語音訓練數據,并采用對比學習的方式構造所述學習模型的數據集;

    31、模型訓練模塊:用于根據所述數據集構造損失函數,根據所述損失函數訓練所述學習模型,直至所述學習模型收斂,得到對所述學習模型訓練完畢后的特征提取模型;

    32、優質片段采集模塊:用于對語音生產數據進行優質片段采集得到聲音段落集合;

    33、特征提取模塊:用于采用所述特征提取模型對所述聲音段落集合進行特征提取得到特征表達;

    34、相似度比對模塊:用于對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果。

    35、第三方面,提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現以下步驟;

    36、在學習模型的訓練過程中輸入語音訓練數據,并采用對比學習的方式構造所述學習模型的數據集;

    37、根據所述數據集構造損失函數,根據所述損失函數訓練所述學習模型,直至所述學習模型收斂,得到對所述學習模型訓練完畢后的特征提取模型;

    38、對語音生產數據進行優質片段采集得到聲音段落集合;

    39、采用所述特征提取模型對所述聲音段落集合進行特征提取得到特征表達;

    40、對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果。

    41、第四方面,提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有程序,當所述程序被處理器執行時,使得所述處理器執行時實現以下步驟:

    42、在學習模型的訓練過程中輸入語音訓練數據,并采用對比學習的方式構造所述學習模型的數據集;

    43、根據所述數據集構造損失函數,根據所述損失函數訓練所述學習模型,直至所述學習模型收斂,得到對所述學習模型訓練完畢后的特征提取模型;

    44、對語音生產數據進行優質片段采集得到聲音段落集合;

    ...

    【技術保護點】

    1.一種聲紋相似度計算方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的聲紋相似度計算方法,其特征在于,所述采用對比學習的方式構造所述學習模型的數據集包括:

    3.根據權利要求2所述的聲紋相似度計算方法,其特征在于,所述損失函數的公式為:

    4.根據權利要求1所述的聲紋相似度計算方法,其特征在于,所述對語音生產數據進行優質片段采集得到聲音段落集合包括:

    5.根據權利要求4所述的聲紋相似度計算方法,其特征在于,對所述語音生產數據先剔除非人聲片段再剔除過短片段得到有效段落集合中的所述剔除非人聲片段包括:

    6.根據權利要求4或5所述的聲紋相似度計算方法,其特征在于,所述對所述有效段落集合剔除低質量片段得到所述聲音段落集合包括:

    7.根據權利要求1所述的聲紋相似度計算方法,其特征在于,所述對不同組所述語音生產數據的所述特征表達進行相似度對比,得到相似度結果包括:

    8.一種聲紋相似度計算系統,其特征在于,包括:

    9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1-7中任一項所述方法的步驟。

    10.一種計算機可讀存儲介質,其特征在于:所述計算機可讀存儲介質存儲有程序,當所述程序被處理器執行時,使得所述處理器執行如權利要求1-7中任一項所述方法的步驟。

    ...

    【技術特征摘要】

    1.一種聲紋相似度計算方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的聲紋相似度計算方法,其特征在于,所述采用對比學習的方式構造所述學習模型的數據集包括:

    3.根據權利要求2所述的聲紋相似度計算方法,其特征在于,所述損失函數的公式為:

    4.根據權利要求1所述的聲紋相似度計算方法,其特征在于,所述對語音生產數據進行優質片段采集得到聲音段落集合包括:

    5.根據權利要求4所述的聲紋相似度計算方法,其特征在于,對所述語音生產數據先剔除非人聲片段再剔除過短片段得到有效段落集合中的所述剔除非人聲片段包括:

    6.根據權利要求4或5所述的聲紋相似度計算方法,其特征在于,...

    【專利技術屬性】
    技術研發人員:孫杰趙漢家,丁擁科,
    申請(專利權)人:眾安在線財產保險股份有限公司,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无遮掩无码h成人av动漫| 无码一区二区三区老色鬼| 无码任你躁久久久久久老妇App| 人妻丰满熟妇AV无码区乱| av中文无码乱人伦在线观看| 亚洲精品高清无码视频| 亚洲熟妇无码AV| 无码中文字幕日韩专区| 日韩精品无码免费视频| 亚洲国产成人精品无码区在线秒播 | 亚洲成av人片不卡无码久久| 亚洲成AV人片在线观看无码| 亚洲AV无码一区二区一二区| 久久午夜夜伦鲁鲁片无码免费| 亚洲成av人片不卡无码久久| 亚洲熟妇无码一区二区三区导航| 日韩精品无码免费专区网站| 日韩人妻系列无码专区| 亚洲精品无码中文久久字幕| 少妇人妻无码专区视频| 亚洲AV综合色区无码另类小说| 国产精品无码一区二区三区在 | 无码任你躁久久久久久老妇App| 亚洲一区精品无码| 中文无码vs无码人妻| 国产在线观看无码免费视频| 人妻无码久久中文字幕专区| 无码av专区丝袜专区| 成人年无码AV片在线观看| 成年轻人电影www无码| 亚洲乱人伦中文字幕无码| 亚洲欧洲国产综合AV无码久久| 久久精品无码专区免费青青| 精品无码国产一区二区三区AV| 国产网红无码精品视频| 亚洲av中文无码乱人伦在线r▽| 亚洲av无码国产精品夜色午夜| 西西午夜无码大胆啪啪国模| 亚洲中文字幕久久精品无码2021| 无码aⅴ精品一区二区三区浪潮| 日韩精品少妇无码受不了|