當(dāng)前位置: 首頁 > 專利查詢>松下電器產(chǎn)業(yè)株式會(huì)社專利>正文

用于識(shí)別說話人的建模設(shè)備和方法、以及說話人識(shí)別系統(tǒng)技術(shù)方案

技術(shù)編號(hào)：8983406 閱讀：193 留言：0更新日期：2013-08-01 02:14

本發(fā)明專利技術(shù)實(shí)現(xiàn)用于識(shí)別說話人的建模設(shè)備和方法、以及說話人識(shí)別系統(tǒng)。建模設(shè)備包括：前端，從各目標(biāo)說話人取得登記語音數(shù)據(jù)；參考錨集合生成單元，基于錨空間使用登記語音數(shù)據(jù)生成參考錨集合；以及聲紋生成單元，基于參考錨集合和登記語音數(shù)據(jù)生成聲紋。在本公開中，通過考慮登記語音和說話人自適應(yīng)技術(shù)，能夠生成尺寸更小的錨模型，因而能夠進(jìn)行具有尺寸更小的參考錨集合的、可靠性高的魯棒的說話人識(shí)別。這對(duì)于進(jìn)行計(jì)算速度的改善以及大幅度的存儲(chǔ)器削減是非常有利的。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】
【國外來華專利技術(shù)】
本公開涉及語音(音頻)處理以及語音識(shí)別技術(shù)，另外涉及說話人對(duì)比、電話會(huì)議、以及數(shù)字網(wǎng)絡(luò)視聽的技術(shù)。
技術(shù)介紹
說話人識(shí)別技術(shù)對(duì)于許多應(yīng)用，例如說話人跟蹤、語音索引(audio index)、以及分段是非常有用的。近年來，提出了使用多個(gè)錨(說話人)模型對(duì)說話人進(jìn)行建模的技術(shù)。將說話人語音投影到錨模型上，構(gòu)成表示說話人的聲學(xué)特性的向量。圖1表示用于進(jìn)行說話人識(shí)別的以往設(shè)備的方框圖。如圖1所示，通過學(xué)習(xí)來自多個(gè)普通說話人的語音，生成錨空間。在參考錨集合生成單元(reference anchor setgeneration unit)102中，從錨空間(anchor space)選擇作為集群(cluster)的重心的多個(gè)虛擬錨說話人(virtual anchor speakers)并形成參考錨集合(reference anchor set),或者選擇距各集群的重心最近的錨說話人并形成參考錨集合。前端101取得目標(biāo)說話人的登記語音，將該登記語音轉(zhuǎn)換為特征參數(shù)，并將這些特征參數(shù)發(fā)送至聲紋(voice print)生成單元103。聲紋生成單元103基于從前端101發(fā)送來的特征參數(shù)以及由參考錨集合生成單元102生成的參考錨集合，生成聲紋。接著，為了進(jìn)一步用于說話人識(shí)別，將生成的聲紋存儲(chǔ)到聲紋數(shù)據(jù)庫104中。
技術(shù)實(shí)現(xiàn)思路
專利技術(shù)要解決的問題根據(jù)圖1可知，由設(shè)備100生成的參考錨集合僅能夠反映錨空間自身的分布。因此，為了更好地表現(xiàn)目標(biāo)說話人，需要更多的錨，因此計(jì)算量增大，難以在嵌入型系統(tǒng)中使用。解決問題的方案在本公開的一個(gè)方式中，實(shí)現(xiàn)用于識(shí)別說話人的建模設(shè)備，該設(shè)備包括:...

【技術(shù)保護(hù)點(diǎn)】

【技術(shù)特征摘要】
【國外來華專利技術(shù)】

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：沈海峰，馬龍，張丙奇，
申請(qǐng)(專利權(quán))人：松下電器產(chǎn)業(yè)株式會(huì)社，
類型：
國別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)