• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于共有鑒別性子空間映射的語種識別方法及裝置制造方法及圖紙

    技術(shù)編號:8656481 閱讀:286 留言:1更新日期:2013-05-02 00:14
    本發(fā)明專利技術(shù)涉及一種基于共有鑒別性子空間映射的語種識別方法及裝置,該方法包括:提取一個語種的多個語音數(shù)據(jù)的語音特征;根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。相比于直接對高斯超向量進行建模,本發(fā)明專利技術(shù)的語種識別方法由于其低維和鑒別性,訓練速度更快,識別性能有了明顯提高。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及語種識別領(lǐng)域,尤其涉及一種基于共有鑒別性子空間映射的語種識別方法及裝置
    技術(shù)介紹
    語種識別技術(shù)的目的在于日后能夠制造一種能夠在一定程度上模仿人的思維對語種進行自動辨識的機器。換言之,就是從語音信號中提取出各語種的差異信息,并以此作為依據(jù)對語種進行識別。在實際應(yīng)用中,由于環(huán)境噪聲以及信道干擾等的影響,使識別性能急劇下降,對識別魯棒性提出了較大的挑戰(zhàn)。因此,如何提高語種識別的魯棒性,減弱或者去除語音信號中的環(huán)境噪聲與信道干擾等的負面影響,是當前語種識別研究的一個熱點。高斯混合模型-支持向量機(GMM-SVM)的方法通過將高斯超向量的思想引入語種識別,在語種識別中得到了成功的應(yīng)用。實驗表明,高斯超向量可以有效表征一段語音數(shù)據(jù)。但是,由于高斯超向量具有較高的維數(shù),在語種種類比較多,數(shù)據(jù)量大的情況下可能會遇到機器內(nèi)存不足,支持向量機模型訓練速度慢甚至訓練不出的情況。因此,對高斯超向量尋找有效的降維方法是當前研究的重點。
    技術(shù)實現(xiàn)思路
    本專利技術(shù)的目的是提供一種能夠克服至少上述缺陷之一的基于共有鑒別性子空間映射的語種識別方法及裝置。在本專利技術(shù)的第一方面,提供了一種基于共有鑒別性子空間映射的語種識別方法,包括提取一個語種的多個語音數(shù)據(jù)的語音特征;根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。在本專利技術(shù)的第二方面,提供了一種基于共有鑒別性子空間映射的語種識別裝置,包括特征提取模塊,用于提取一個語種的多個語音數(shù)據(jù)的語音特征;高斯超向量獲取模塊,用于根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;共有鑒別性子空間映射模塊,用于將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及識別模塊,用于分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。本專利技術(shù)通過將高維的高斯超向量映射到較低維的子空間,然后對低維向量訓練模型并打分,從而對測試語音進行識別。相比于直接對高斯超向量進行建模,本專利技術(shù)的語種識別方法由于其低維和鑒別性,訓練速度更快,識別性能有了明顯提高。另外,減少部分語種的訓練數(shù)據(jù)求子空間,其識別性能并不會明顯下降。本專利技術(shù)的系統(tǒng)有效利用了高斯超向量所攜帶的語種信息,通過對超向量降維,去除了超向量中的冗余信息,充分保留了可以代表語音的成分。傳統(tǒng)方法對高斯超向量直接SVM建模,由于訓練數(shù)據(jù)大,向量維數(shù)高,建模速度慢,甚至會出現(xiàn)長時間無法訓出SVM的情況,如果直接用cosine建模,雖然模型訓練速度加快,但識別性能不高。共有鑒別性子空間映射的方法,不僅對高斯超向量進行降維,使SVM訓練速度更快,而且由于該方法對各語種間的共有向量進行拼接組成共有子空間,既有不同語種間的共同成分,又提高了各語種間的區(qū)分能力。附圖說明圖1是根據(jù)本專利技術(shù)實施例的基于共有鑒別性子空間映射的語種識別方法的流程圖;圖2是根據(jù)本專利技術(shù)實施例的基于共有鑒別性子空間映射的語種識別方法的訓練階段的流程圖;圖3是根據(jù)本專利技術(shù)實施例的基于共有鑒別性子空間映射的語種識別裝置的示意圖。具體實施例方式下面通過附圖和實施例,對本專利技術(shù)的技術(shù)方案做進一步的詳細描述。因此,本專利技術(shù)的目的在于提供一種基于共有鑒別性子空間映射的語種識別方法,該方法通過尋找各語種共有的具有鑒別性的子空間,將高維的高斯超向量映射到低維子空間,用映射后得到的低維的高斯超向量訓練SVM模型,不僅加快了模型訓練速度,而且還提高了語種識別的性能。圖1是根據(jù)本專利技術(shù)實施例的基于共有鑒別性子空間映射的語種識別方法的流程圖。在步驟101,提取一個語種的多個語音數(shù)據(jù)的移位差分美爾倒譜MSDC特征。在步驟102,根據(jù)所述MSDC特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量。例如,通過最大后驗概率MAP從高斯混合模型GMM得到所述語音數(shù)據(jù)的高斯分布均值,所述GMM是預先用多個語種的語音數(shù)據(jù)建立的。然后,將所述高斯分布均值按順序排列得到所述高斯超向量。在步驟103,將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的。在步驟104,分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。另外,還可以用開發(fā)集數(shù)據(jù)進行上述步驟得出其在SVM模型上的得分,用于對上述得分進行規(guī)整和校正。根據(jù)本專利技術(shù)的最終得分結(jié)果也可以與其他系統(tǒng)的得分進行融合。圖2是根據(jù)本專利技術(shù)實施例的基于共有鑒別性子空間映射的語種識別方法的訓練階段的流程圖。訓練階段是為語音識別做準備的,此階段主要建立了針對多語種的高斯混合模型GMM和針對各語種的支持向量機SVM模型。在步驟201,提取多個語種的多個語音數(shù)據(jù)的移位差分美爾倒譜MSDC特征。在步驟202,根據(jù)所述MSDC特征得到每個語音數(shù)據(jù)的高斯超向量。首先,根據(jù)所述MSDC特征訓練出高斯混合模型GMM,稱之為全局背景模型(UBM),可以表示為:本文檔來自技高網(wǎng)...

    【技術(shù)保護點】
    一種基于共有鑒別性子空間映射的語種識別方法,包括:提取一個語種的多個語音數(shù)據(jù)的語音特征;根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。

    【技術(shù)特征摘要】
    1.一種基于共有鑒別性子空間映射的語種識別方法,包括: 提取一個語種的多個語音數(shù)據(jù)的語音特征; 根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量; 將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及 分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量的步驟包括: 通過最大后驗概率MAP從高斯混合模型GMM得到所述語音數(shù)據(jù)的高斯分布均值,所述GMM是預先用多個語種的語音數(shù)據(jù)建立的;以及 將所述高斯分布均值按順序排列得到所述高斯超向量。3.根據(jù)權(quán)利要求1所述的方法,其中,所述共有鑒別性子空間是通過下列步驟得到的: 提取多個語種的多個語音數(shù)據(jù)的語音特征; 根據(jù)所述語音特征得到每個語音數(shù)據(jù)的高斯超向量; 計算每個語種的高斯超向量均值; 根據(jù)所述高斯超向量得到每個語種的標準正交基; 將每個語種的高斯超向量均值分別映射到其他多個語種的標準正交基上,得到每個語種對應(yīng)于其他語種的冗余向量; 根據(jù)所述冗余向量和每個語種的高斯超向量得到共有向量集;以及 根據(jù)所述共有向量集得到所述共有鑒別性子空間。4.根據(jù)權(quán)利要求3所述的方法,其中,所述多個SVM模型的訓練包括下列步驟: 將每個語音數(shù)據(jù)的高斯超向量映射到所述共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量;以及 用支持向量機SVM分類器訓練所述低維向量,得到所述多個SVM模型。5.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述MSDC特征得到每個語音數(shù)據(jù)的高斯超向量的步驟包括: 根據(jù)所述語音特征訓練出高斯混合模型G...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:周若華顏永紅王憲亮劉建
    申請(專利權(quán))人:中國科學院聲學研究所北京中科信利技術(shù)有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有1條評論
    • 來自[美國加利福尼亞州圣克拉拉縣山景市谷歌公司] 2014年12月07日 11:11
      共有是指某項財產(chǎn)由兩個或兩個以上的權(quán)利主體共有享有所有權(quán)包括公民之間的共有法人之間的共有以及公民和法人之間的共有
      0
    1
    主站蜘蛛池模板: 久久久久久亚洲av无码蜜芽| 国产精品99久久久精品无码| 在线精品自偷自拍无码中文| 亚洲av无码片vr一区二区三区 | 日本无码一区二区三区白峰美 | 无码人妻啪啪一区二区| 日本无码一区二区三区白峰美| 97无码人妻福利免费公开在线视频| 精品无码人妻一区二区三区品| 国产无码网页在线观看| 精品三级AV无码一区| 精品人妻少妇嫩草AV无码专区| 亚洲熟妇无码一区二区三区| 亚洲人成人无码网www电影首页 | 亚欧无码精品无码有性视频| 日韩精品无码免费一区二区三区| 国产成人无码精品久久久免费 | 无码人妻品一区二区三区精99| 精品久久久久久无码人妻| 麻豆aⅴ精品无码一区二区| 久久国产精品无码网站| 精品无码成人久久久久久| 人禽无码视频在线观看| 亚洲av日韩av高潮潮喷无码 | 亚洲成AV人片天堂网无码| 东京热无码av一区二区| 久青草无码视频在线观看| 在线看片无码永久免费aⅴ| 人妻丰满熟AV无码区HD| 乱人伦人妻中文字幕无码 | 亚洲精品无码少妇30P| 无码国产69精品久久久久网站| 国产亚洲人成无码网在线观看| 国产精品亚洲αv天堂无码| 精品一区二区三区无码视频| 最新中文字幕av无码专区| 99国产精品无码| 亚洲AV无码专区在线观看成人| 性色av极品无码专区亚洲| 日韩精品无码成人专区| 精品无人区无码乱码毛片国产|