【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及語種識別領(lǐng)域,尤其涉及一種基于共有鑒別性子空間映射的語種識別方法及裝置。
技術(shù)介紹
語種識別技術(shù)的目的在于日后能夠制造一種能夠在一定程度上模仿人的思維對語種進行自動辨識的機器。換言之,就是從語音信號中提取出各語種的差異信息,并以此作為依據(jù)對語種進行識別。在實際應(yīng)用中,由于環(huán)境噪聲以及信道干擾等的影響,使識別性能急劇下降,對識別魯棒性提出了較大的挑戰(zhàn)。因此,如何提高語種識別的魯棒性,減弱或者去除語音信號中的環(huán)境噪聲與信道干擾等的負面影響,是當前語種識別研究的一個熱點。高斯混合模型-支持向量機(GMM-SVM)的方法通過將高斯超向量的思想引入語種識別,在語種識別中得到了成功的應(yīng)用。實驗表明,高斯超向量可以有效表征一段語音數(shù)據(jù)。但是,由于高斯超向量具有較高的維數(shù),在語種種類比較多,數(shù)據(jù)量大的情況下可能會遇到機器內(nèi)存不足,支持向量機模型訓練速度慢甚至訓練不出的情況。因此,對高斯超向量尋找有效的降維方法是當前研究的重點。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目的是提供一種能夠克服至少上述缺陷之一的基于共有鑒別性子空間映射的語種識別方法及裝置。在本專利技術(shù)的第一方面,提供了一種基于共有鑒別性子空間映射的語種識別方法,包括提取一個語種的多個語音數(shù)據(jù)的語音特征;根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其 ...
【技術(shù)保護點】
一種基于共有鑒別性子空間映射的語種識別方法,包括:提取一個語種的多個語音數(shù)據(jù)的語音特征;根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量;將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。
【技術(shù)特征摘要】
1.一種基于共有鑒別性子空間映射的語種識別方法,包括: 提取一個語種的多個語音數(shù)據(jù)的語音特征; 根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量,其中,每個語音數(shù)據(jù)對應(yīng)一組高斯超向量; 將所述高斯超向量映射到共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量,其中,所述共有鑒別性子空間是預先用多個語種的語音數(shù)據(jù)建立的;以及 分別計算所述低維向量在多個支持向量機SVM模型上的得分,根據(jù)多個得分識別出所述語種,其中,所述多個SVM模型是預先根據(jù)所述共有鑒別性子空間訓練出來的,每個SVM模型對應(yīng)一個語種。2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述語音特征得到所述多個語音數(shù)據(jù)的高斯超向量的步驟包括: 通過最大后驗概率MAP從高斯混合模型GMM得到所述語音數(shù)據(jù)的高斯分布均值,所述GMM是預先用多個語種的語音數(shù)據(jù)建立的;以及 將所述高斯分布均值按順序排列得到所述高斯超向量。3.根據(jù)權(quán)利要求1所述的方法,其中,所述共有鑒別性子空間是通過下列步驟得到的: 提取多個語種的多個語音數(shù)據(jù)的語音特征; 根據(jù)所述語音特征得到每個語音數(shù)據(jù)的高斯超向量; 計算每個語種的高斯超向量均值; 根據(jù)所述高斯超向量得到每個語種的標準正交基; 將每個語種的高斯超向量均值分別映射到其他多個語種的標準正交基上,得到每個語種對應(yīng)于其他語種的冗余向量; 根據(jù)所述冗余向量和每個語種的高斯超向量得到共有向量集;以及 根據(jù)所述共有向量集得到所述共有鑒別性子空間。4.根據(jù)權(quán)利要求3所述的方法,其中,所述多個SVM模型的訓練包括下列步驟: 將每個語音數(shù)據(jù)的高斯超向量映射到所述共有鑒別性子空間,得到與所述高斯超向量對應(yīng)的低維向量;以及 用支持向量機SVM分類器訓練所述低維向量,得到所述多個SVM模型。5.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述MSDC特征得到每個語音數(shù)據(jù)的高斯超向量的步驟包括: 根據(jù)所述語音特征訓練出高斯混合模型G...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:周若華,顏永紅,王憲亮,劉建,
申請(專利權(quán))人:中國科學院聲學研究所,北京中科信利技術(shù)有限公司,
類型:發(fā)明
國別省市: