當(dāng)前位置: 首頁(yè) > 專利查詢>OPPO廣東移動(dòng)通信有限公司專利>正文

聲學(xué)特征提取方法、裝置、存儲(chǔ)介質(zhì)及終端設(shè)備制造方法及圖紙

技術(shù)編號(hào)：20007133 閱讀：33 留言：0更新日期：2019-01-05 18:42

本申請(qǐng)實(shí)施例中提供的一種聲學(xué)特征提取方法、裝置、存儲(chǔ)介質(zhì)及終端設(shè)備，該方法包括：獲取待處理語(yǔ)音信號(hào)；對(duì)所述待處理語(yǔ)音信號(hào)進(jìn)行分幀處理，得到以幀為單位的連續(xù)的語(yǔ)音數(shù)據(jù)塊，其中，每?jī)蓚€(gè)相鄰幀的語(yǔ)音數(shù)據(jù)塊中，前一幀的語(yǔ)音數(shù)據(jù)塊中的最后一個(gè)數(shù)據(jù)和后一幀的語(yǔ)音數(shù)據(jù)塊中的第一個(gè)數(shù)據(jù)在時(shí)域上保持連續(xù)；對(duì)所述語(yǔ)音數(shù)據(jù)塊進(jìn)行加窗處理和傅里葉變換處理，以得到語(yǔ)音能量譜；將所述語(yǔ)音能量譜通過(guò)梅爾濾波器組，以得到梅爾頻譜數(shù)據(jù)；根據(jù)所述梅爾頻譜數(shù)據(jù)確定梅爾頻率倒譜系數(shù)。通過(guò)采用上述技術(shù)方案，可以降低提取梅爾頻率倒譜系數(shù)時(shí)對(duì)每幀數(shù)據(jù)的算法的次數(shù)，可以降低提取聲學(xué)特征帶來(lái)的功耗。

Acoustic feature extraction method, device, storage medium and terminal equipment

An acoustic feature extraction method, device, storage medium and terminal device provided in the embodiment of the present application includes: acquiring speech signal to be processed; subframe processing of the speech signal to be processed to obtain a continuous voice data block in frame units, in which the last of the voice data blocks of the previous frame is the last of the voice data blocks of each two adjacent frames. The data and the first data in the voice data block of the latter frame remain continuous in time domain; the voice energy spectrum is obtained by windowing and Fourier transform processing of the voice data block; the voice energy spectrum is obtained through the Mel filter bank to obtain the Mel spectrum data; and the Mel frequency cepstrum coefficient is determined according to the Mel spectrum data. By adopting the above technical scheme, the number of algorithms for extracting Meier frequency cepstrum coefficients for each frame can be reduced, and the power consumption for extracting acoustic characteristics can be reduced.

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】
聲學(xué)特征提取方法、裝置、存儲(chǔ)介質(zhì)及終端設(shè)備
本申請(qǐng)實(shí)施例涉及信號(hào)處理
，尤其涉及一種聲學(xué)特征提取方法、裝置、存儲(chǔ)介質(zhì)及終端設(shè)備。
技術(shù)介紹
隨著終端設(shè)備的快速發(fā)展，越來(lái)越多的語(yǔ)音功能應(yīng)用到終端設(shè)備中，例如聲紋喚醒和語(yǔ)音識(shí)別等等。梅爾頻率倒譜系數(shù)(MFCC,MelFrequencyCepstrumCoefficient)是基于人耳的聽覺(jué)而導(dǎo)出的聲學(xué)特征，廣泛應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域應(yīng)，在進(jìn)行聲紋喚醒或者語(yǔ)音識(shí)別時(shí)，通常需要從語(yǔ)音數(shù)據(jù)中提取出梅爾頻率倒譜系數(shù)作為識(shí)別語(yǔ)音的特征。而現(xiàn)有技術(shù)中對(duì)梅爾頻率倒譜系數(shù)的提取處理會(huì)造成終端設(shè)備的較多的功耗，所以需要對(duì)梅爾頻率倒譜系數(shù)的提取方法進(jìn)行優(yōu)化。
技術(shù)實(shí)現(xiàn)思路
本申請(qǐng)實(shí)施例提供的一種聲學(xué)特征提取方法、裝置、存儲(chǔ)介質(zhì)及終端設(shè)備，可以降低終端設(shè)備的功耗。第一方面，本申請(qǐng)實(shí)施例提供了一種聲學(xué)特征提取方法，包括：獲取待處理語(yǔ)音信號(hào)；對(duì)所述待處理語(yǔ)音信號(hào)進(jìn)行分幀處理，得到以幀為單位的連續(xù)的語(yǔ)音數(shù)據(jù)塊，其中，每?jī)蓚€(gè)相鄰幀的語(yǔ)音數(shù)據(jù)塊中，前一幀的語(yǔ)音數(shù)據(jù)塊中的最后一個(gè)數(shù)據(jù)和后一幀的語(yǔ)音數(shù)據(jù)塊中的第一個(gè)數(shù)據(jù)在時(shí)域上保持連續(xù)；對(duì)所述語(yǔ)音數(shù)據(jù)塊進(jìn)行加窗處理和傅里葉變換處理，以得到語(yǔ)音能量譜；將所述語(yǔ)音能量譜通過(guò)梅爾濾波器組，以得到梅爾頻譜數(shù)據(jù)；根據(jù)所述梅爾頻譜數(shù)據(jù)確定梅爾頻率倒譜系數(shù)。第二方面，本申請(qǐng)實(shí)施例提供了一種聲學(xué)特征提取裝置，包括：信號(hào)獲取模塊，用于獲取待處理語(yǔ)音信號(hào)；分幀模塊，用于對(duì)所述待處理語(yǔ)音信號(hào)進(jìn)行分幀處理，得到以幀為單位的連續(xù)的語(yǔ)音數(shù)據(jù)塊，其中，每?jī)蓚€(gè)相鄰幀的語(yǔ)音數(shù)據(jù)塊中，前一幀的語(yǔ)音數(shù)據(jù)塊中的最后一個(gè)數(shù)據(jù)和后一幀的語(yǔ)音數(shù)...

【技術(shù)保護(hù)點(diǎn)】
1.一種聲學(xué)特征提取方法，其特征在于，包括：獲取待處理語(yǔ)音信號(hào)；對(duì)所述待處理語(yǔ)音信號(hào)進(jìn)行分幀處理，得到以幀為單位的連續(xù)的語(yǔ)音數(shù)據(jù)塊，其中，每?jī)蓚€(gè)相鄰幀的語(yǔ)音數(shù)據(jù)塊中，前一幀的語(yǔ)音數(shù)據(jù)塊中的最后一個(gè)數(shù)據(jù)和后一幀的語(yǔ)音數(shù)據(jù)塊中的第一個(gè)數(shù)據(jù)在時(shí)域上保持連續(xù)；對(duì)所述語(yǔ)音數(shù)據(jù)塊進(jìn)行加窗處理和傅里葉變換處理，以得到語(yǔ)音能量譜；將所述語(yǔ)音能量譜通過(guò)梅爾濾波器組，以得到梅爾頻譜數(shù)據(jù)；根據(jù)所述梅爾頻譜數(shù)據(jù)確定梅爾頻率倒譜系數(shù)。

【技術(shù)特征摘要】
1.一種聲學(xué)特征提取方法，其特征在于，包括：獲取待處理語(yǔ)音信號(hào)；對(duì)所述待處理語(yǔ)音信號(hào)進(jìn)行分幀處理，得到以幀為單位的連續(xù)的語(yǔ)音數(shù)據(jù)塊，其中，每?jī)蓚€(gè)相鄰幀的語(yǔ)音數(shù)據(jù)塊中，前一幀的語(yǔ)音數(shù)據(jù)塊中的最后一個(gè)數(shù)據(jù)和后一幀的語(yǔ)音數(shù)據(jù)塊中的第一個(gè)數(shù)據(jù)在時(shí)域上保持連續(xù)；對(duì)所述語(yǔ)音數(shù)據(jù)塊進(jìn)行加窗處理和傅里葉變換處理，以得到語(yǔ)音能量譜；將所述語(yǔ)音能量譜通過(guò)梅爾濾波器組，以得到梅爾頻譜數(shù)據(jù)；根據(jù)所述梅爾頻譜數(shù)據(jù)確定梅爾頻率倒譜系數(shù)。2.如權(quán)利要求1所述的方法，其特征在于，所述梅爾濾波器組為矩形濾波器組，所述矩形濾波器組中的每個(gè)矩形濾波器的中心頻率在梅爾頻率上依次等間隔排列，每個(gè)矩形濾波器的在頻域上的寬度和對(duì)應(yīng)的梅爾頻率區(qū)間對(duì)應(yīng)。3.如權(quán)利要求2所述的方法，其特征在于，所述矩形濾波器組的中心頻率在頻域和梅爾頻率的映射關(guān)系符合如下公式：其中，所述f為頻域上的頻率，所述Mel(f)為梅爾頻率。4.如權(quán)利要求2所述的方法，其特征在于，所述矩形濾波器組的每個(gè)矩形濾波器的幅值均相同。5.如權(quán)利要求4所述的方法，其特征在于，所述矩形濾波器的幅值為1。6.如權(quán)利要求1至5任一項(xiàng)所述的方法，其特征在于，根據(jù)所述梅爾頻譜數(shù)據(jù)確定梅爾頻率倒譜系數(shù)包括：對(duì)所述梅爾頻譜數(shù)據(jù)進(jìn)行離散余弦變換，以確定梅爾頻率倒譜系數(shù)，其中，每一幀的離散余...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：陳巖，
申請(qǐng)(專利權(quán))人：OPPO廣東移動(dòng)通信有限公司，
類型：發(fā)明
國(guó)別省市：廣東,44

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條評(píng)論

還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)

終端設(shè)備技術(shù)

終端設(shè)備是什么技術(shù)