本發(fā)明專(zhuān)利技術(shù)提供了一種自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備及遠(yuǎn)場(chǎng)語(yǔ)音自校準(zhǔn)方法,麥克風(fēng)陣列采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),自校準(zhǔn)和語(yǔ)音識(shí)別終端對(duì)由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差進(jìn)行校準(zhǔn),得到增強(qiáng)語(yǔ)音輸出。本發(fā)明專(zhuān)利技術(shù)利用通道增益校準(zhǔn)的方式,保證各個(gè)麥克風(fēng)通道相對(duì)增益一致,提高了后端GSC的性能;采用語(yǔ)音段作為校準(zhǔn)聲源,后續(xù)處理保證語(yǔ)音損傷較小,有利于目標(biāo)信號(hào)的消除和噪聲干擾信號(hào)的保留;還可以自動(dòng)判斷麥克風(fēng)工作狀態(tài),能夠保證在麥克風(fēng)損壞情況下,設(shè)備仍然能夠正常工作,提高了設(shè)備的穩(wěn)健性。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)總體上涉及語(yǔ)音處理
,尤其涉及自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備及遠(yuǎn)場(chǎng)語(yǔ)音自校準(zhǔn)方法。
技術(shù)介紹
麥克風(fēng)陣列技術(shù)近幾十年來(lái)受到了研究者的廣泛關(guān)注,特別是最近幾年來(lái)受到人工智能繁榮發(fā)展的驅(qū)動(dòng),遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù)得到更大的關(guān)注,對(duì)作為遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別前端的麥克風(fēng)陣列技術(shù)提出了更大的要求。目前針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別的主要方法包括MVDR(MinimumVarianceDistortionlessResponse,最小方差無(wú)畸變響應(yīng))和多通道維納濾波方法,不管哪一種方法都是進(jìn)行了遠(yuǎn)場(chǎng)假設(shè),通常認(rèn)為通道到達(dá)每個(gè)麥克風(fēng)的幅度一致,只是聲波到達(dá)時(shí)間不同,但實(shí)際中通常不同通道麥克風(fēng)增益不同,同時(shí)由于距離衰減等因素造成幅度差異,因此需要對(duì)麥克風(fēng)增益及信號(hào)幅度衰減進(jìn)行補(bǔ)償,才能保證算法性能。同時(shí)上述算法都需要明確麥克風(fēng)的準(zhǔn)確位置,大量方法與研究也是基于麥克風(fēng)準(zhǔn)確位置設(shè)計(jì)的,并且所有麥克風(fēng)都能正常工作,極端情況下,一旦麥克風(fēng)無(wú)法正常錄音工作,將導(dǎo)致算法性能急劇下降,在實(shí)際產(chǎn)品應(yīng)用中,麥克風(fēng)位置通常是已知的,但在使用過(guò)程中很難保證其中的某個(gè)麥克風(fēng)發(fā)生問(wèn)題,無(wú)法正常錄音,這種情形下需要剔除問(wèn)題麥克風(fēng),此時(shí)原有的麥克風(fēng)位置信息需要更新,為保證陣列算法仍然能夠正常工作,此時(shí)需要校準(zhǔn)確定正常麥克風(fēng)陣列構(gòu)成的新麥克風(fēng)陣列及其相關(guān)信息。現(xiàn)有技術(shù)對(duì)麥克風(fēng)信號(hào)的校準(zhǔn),通常采用大型校準(zhǔn)設(shè)備在專(zhuān)用的實(shí)驗(yàn)室內(nèi)完成,非常費(fèi)時(shí)費(fèi)力,并不適用于消費(fèi)電子。例如,現(xiàn)有技術(shù)一(CN200810213962,一種麥克風(fēng)陣列及麥克風(fēng)陣列校準(zhǔn)的方法和模塊)采用靜默期的背景噪聲作為校準(zhǔn)聲源,計(jì)算不同通道的增益,調(diào)整不同通道到相同增益。該技術(shù)方案采用靜默期的相干性較低的背景噪聲作為校準(zhǔn)聲源,麥克風(fēng)接收信號(hào)的信噪比較低,校準(zhǔn)誤差較大,同時(shí)只考慮麥克風(fēng)自身的增益,沒(méi)有考慮傳播衰減等造成的幅度誤差,特別對(duì)于遠(yuǎn)場(chǎng)情形下,各麥克風(fēng)的語(yǔ)音信號(hào)之間仍然存在較大幅度誤差,不適合于麥克風(fēng)陣列信號(hào)處理。現(xiàn)有技術(shù)二“Robustspeechrecognitionusingbeamformingwithadaptivemicrophonegainsandmultichannelnoisereduction”采用語(yǔ)音段信號(hào)作為校準(zhǔn)聲源,計(jì)算不同通道的增益。該技術(shù)方案一方面在增益計(jì)算中沒(méi)有剔出噪聲的影響,噪聲增益計(jì)算不準(zhǔn)確,另一方面對(duì)于極端情況,即麥克風(fēng)損壞無(wú)法正常工作的情形下,針對(duì)麥克風(fēng)陣列沒(méi)有提出解決方案。
技術(shù)實(shí)現(xiàn)思路
(一)要解決的技術(shù)問(wèn)題本專(zhuān)利技術(shù)提供了一種自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備及遠(yuǎn)場(chǎng)語(yǔ)音自校準(zhǔn)方法。(二)技術(shù)方案本專(zhuān)利技術(shù)提供了一種自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,包括:麥克風(fēng)陣列與自校準(zhǔn)和語(yǔ)音識(shí)別終端,所述麥克風(fēng)陣列與所述自校準(zhǔn)和語(yǔ)音識(shí)別終端電性連接;所述麥克風(fēng)陣列采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),并將所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至所述自校準(zhǔn)和語(yǔ)音識(shí)別終端,其中,所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)包含由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差;所述自校準(zhǔn)和語(yǔ)音識(shí)別終端對(duì)所述誤差進(jìn)行校準(zhǔn),得到增強(qiáng)語(yǔ)音輸出。本專(zhuān)利技術(shù)還提供了一種遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的自校準(zhǔn)方法,包括:采集步驟:采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào);校準(zhǔn)步驟:對(duì)遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)的由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差進(jìn)行校準(zhǔn);處理步驟:對(duì)校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)進(jìn)行處理,得到增強(qiáng)語(yǔ)音輸出。(三)有益效果從上述技術(shù)方案可以看出,本專(zhuān)利技術(shù)的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備及遠(yuǎn)場(chǎng)語(yǔ)音自校準(zhǔn)方法具有以下有益效果:(1)利用通道增益校準(zhǔn)的方式,保證各個(gè)麥克風(fēng)通道相對(duì)增益一致,使得進(jìn)入GSC的各個(gè)通道期望目標(biāo)信號(hào)幅度一致,提高了后端GSC的性能;(2)采用語(yǔ)音段作為校準(zhǔn)聲源,不僅有利于固定波束形成,同時(shí)對(duì)于阻塞矩陣模塊,當(dāng)語(yǔ)音段幅度保持一致時(shí),阻塞矩陣模塊處理后殘留的語(yǔ)音段較少,后續(xù)處理保證語(yǔ)音損傷較小,有利于目標(biāo)信號(hào)消除,而保留噪聲或者干擾信號(hào);(3)還可以自動(dòng)判斷麥克風(fēng)工作狀態(tài),能夠保證在麥克風(fēng)損壞情況下,設(shè)備仍然能夠正常工作,提高了設(shè)備的穩(wěn)健性。附圖說(shuō)明為了更完整地理解本專(zhuān)利技術(shù)及其優(yōu)勢(shì),現(xiàn)在將參考結(jié)合附圖的以下描述,其中:圖1為本專(zhuān)利技術(shù)實(shí)施例的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的整體結(jié)構(gòu)圖;圖2為本專(zhuān)利技術(shù)實(shí)施例的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的結(jié)構(gòu)示意圖;圖3為本專(zhuān)利技術(shù)另一實(shí)施例的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的結(jié)構(gòu)示意圖;圖4為本專(zhuān)利技術(shù)又一實(shí)施例的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的結(jié)構(gòu)示意圖;圖5為本專(zhuān)利技術(shù)再一實(shí)施例的自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備的整體結(jié)構(gòu)圖;圖6為本專(zhuān)利技術(shù)實(shí)施例的遠(yuǎn)場(chǎng)語(yǔ)音自校準(zhǔn)方法的流程圖。【符號(hào)說(shuō)明】10-麥克風(fēng)陣列;20-自校準(zhǔn)和語(yǔ)音識(shí)別終端;21-語(yǔ)音活動(dòng)檢測(cè)模塊;22-相對(duì)增益計(jì)算模塊;23-增益校準(zhǔn)模塊;24-固定波束形成參數(shù)校準(zhǔn)模塊;25-信噪比計(jì)算模塊;31-固定波束形成模塊;32-阻塞矩陣模塊;33-自適應(yīng)噪聲抵消模塊;34-增強(qiáng)語(yǔ)音輸出;35-語(yǔ)音段判定模塊;40-控制端。具體實(shí)施方式根據(jù)結(jié)合附圖對(duì)本專(zhuān)利技術(shù)示例性實(shí)施例的以下詳細(xì)描述,本專(zhuān)利技術(shù)的其它方面、優(yōu)勢(shì)和突出特征對(duì)于本領(lǐng)域技術(shù)人員將變得顯而易見(jiàn)。在本專(zhuān)利技術(shù)中,術(shù)語(yǔ)“包括”和“含有”及其派生詞意為包括而非限制;術(shù)語(yǔ)“或”是包含性的,意為和/或。在本說(shuō)明書(shū)中,下述用于描述本專(zhuān)利技術(shù)原理的各種實(shí)施例只是說(shuō)明,不應(yīng)該以任何方式解釋為限制專(zhuān)利技術(shù)的范圍。參照附圖的下述描述用于幫助全面理解由權(quán)利要求及其等同物限定的本專(zhuān)利技術(shù)的示例性實(shí)施例。下述描述包括多種具體細(xì)節(jié)來(lái)幫助理解,但這些細(xì)節(jié)應(yīng)認(rèn)為僅僅是示例性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)認(rèn)識(shí)到,在不背離本專(zhuān)利技術(shù)的范圍和精神的情況下,可以對(duì)本文中描述的實(shí)施例進(jìn)行多種改變和修改。此外,為了清楚和簡(jiǎn)潔起見(jiàn),省略了公知功能和結(jié)構(gòu)的描述。此外,貫穿附圖,相同參考數(shù)字用于相似功能和操作。語(yǔ)音信號(hào)的校準(zhǔn),目標(biāo)包含麥克風(fēng)自身增益差異和由傳播衰減等造成的幅度衰減構(gòu)成的誤差,這些誤差將造成遠(yuǎn)場(chǎng)語(yǔ)音增強(qiáng)性能下降。極端情況下,麥克風(fēng)的損壞將使得遠(yuǎn)場(chǎng)語(yǔ)音增強(qiáng)完全失效。因此,本專(zhuān)利技術(shù)不但對(duì)麥克風(fēng)的誤差進(jìn)行校準(zhǔn),同時(shí)也對(duì)麥克風(fēng)陣列進(jìn)行校準(zhǔn),使得遠(yuǎn)場(chǎng)語(yǔ)音增強(qiáng)在某個(gè)麥克風(fēng)損壞情形下仍然能夠正常工作。本專(zhuān)利技術(shù)實(shí)施例的一種遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,參見(jiàn)圖1,其帶有自校準(zhǔn)功能,該遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備包括:麥克風(fēng)陣列10、與自校準(zhǔn)和語(yǔ)音識(shí)別終端20,麥克風(fēng)陣列10與自校準(zhǔn)和語(yǔ)音識(shí)別終端20電性連接。自校準(zhǔn)和語(yǔ)音識(shí)別終端20包括:自校準(zhǔn)模塊和廣義旁瓣對(duì)消器(GSC,GeneralSidelobeCancellation),麥克風(fēng)陣列10連接自校準(zhǔn)模塊,自校準(zhǔn)模塊連接GSC,其中,麥克風(fēng)陣列10采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),并將遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至自校準(zhǔn)模塊,自校準(zhǔn)模塊對(duì)遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)的由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差進(jìn)行校準(zhǔn),并且檢測(cè)麥克風(fēng)陣列的工作狀態(tài),校準(zhǔn)固定波束形成(FBF,F(xiàn)ixedBeamforming)參數(shù),校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至GSC,GSC利用校準(zhǔn)后的FBF參數(shù)對(duì)校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)進(jìn)行處理,得到增強(qiáng)語(yǔ)音輸出34。麥克風(fēng)陣列10是由多個(gè)麥克風(fēng)組成的封閉式陣列,在圖1中,麥克風(fēng)陣列包括4個(gè)麥克風(fēng)(mic1、mic2、mic3、mic4),但麥克風(fēng)的數(shù)量可以根據(jù)需要設(shè)置,例如大于等于5個(gè),麥克風(fēng)陣列的形狀可以是矩形、圓形、橢圓形等。麥克風(fēng)陣列的各個(gè)麥克風(fēng)用于采集原始的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),由于各個(gè)麥克風(fēng)的通道增益有所差異本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,其特征在于,包括:麥克風(fēng)陣列與自校準(zhǔn)和語(yǔ)音識(shí)別終端,所述麥克風(fēng)陣列與所述自校準(zhǔn)和語(yǔ)音識(shí)別終端電性連接;所述麥克風(fēng)陣列采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),并將所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至所述自校準(zhǔn)和語(yǔ)音識(shí)別終端,其中,所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)包含由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差;所述自校準(zhǔn)和語(yǔ)音識(shí)別終端對(duì)所述誤差進(jìn)行校準(zhǔn),得到增強(qiáng)語(yǔ)音輸出。
【技術(shù)特征摘要】
1.一種自校準(zhǔn)的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,其特征在于,包括:麥克風(fēng)陣列與自校準(zhǔn)和語(yǔ)音識(shí)別終端,所述麥克風(fēng)陣列與所述自校準(zhǔn)和語(yǔ)音識(shí)別終端電性連接;所述麥克風(fēng)陣列采集遠(yuǎn)場(chǎng)語(yǔ)音信號(hào),并將所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至所述自校準(zhǔn)和語(yǔ)音識(shí)別終端,其中,所述遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)包含由麥克風(fēng)通道增益和信號(hào)傳播衰減引起的誤差;所述自校準(zhǔn)和語(yǔ)音識(shí)別終端對(duì)所述誤差進(jìn)行校準(zhǔn),得到增強(qiáng)語(yǔ)音輸出。2.如權(quán)利要求1所述的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,其特征在于,所述自校準(zhǔn)和語(yǔ)音識(shí)別終端包括:自校準(zhǔn)模塊和廣義旁瓣對(duì)消器,所述麥克風(fēng)陣列連接自校準(zhǔn)模塊,所述自校準(zhǔn)模塊連接所述廣義旁瓣對(duì)消器,其中,所述自校準(zhǔn)模塊對(duì)所述誤差進(jìn)行校準(zhǔn),校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)傳輸至所述廣義旁瓣對(duì)消器;所述廣義旁瓣對(duì)消器對(duì)校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)進(jìn)行處理,得到增強(qiáng)語(yǔ)音輸出。3.如權(quán)利要求2所述的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,其特征在于,所述自校準(zhǔn)模塊包括:語(yǔ)音活動(dòng)檢測(cè)模塊、相對(duì)增益計(jì)算模塊和增益校準(zhǔn)模塊;其中,所述語(yǔ)音活動(dòng)檢測(cè)模塊選取麥克風(fēng)陣列的一個(gè)麥克風(fēng)作為參考通道,利用所述參考通道提取遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)中的語(yǔ)音段;所述相對(duì)增益計(jì)算模塊連接所述語(yǔ)音活動(dòng)檢測(cè)模塊,利用所述語(yǔ)音段計(jì)算麥克風(fēng)陣列中的其他麥克風(fēng)相對(duì)于所述參考通道的相對(duì)增益;所述增益校準(zhǔn)模塊連接所述相對(duì)增益計(jì)算模塊,根據(jù)所述相對(duì)增益,將其他麥克風(fēng)的語(yǔ)音段調(diào)整到參考通道的增益水平,得到校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)。4.如權(quán)利要求2所述的遠(yuǎn)場(chǎng)語(yǔ)音交互設(shè)備,其特征在于,所述廣義旁瓣對(duì)消器包括:固定波束形成模塊、阻塞矩陣模塊、自適應(yīng)噪聲抵消模塊;其中,校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)分別進(jìn)入固定波束形成模塊和阻塞矩陣模塊;固定波束形成模塊對(duì)校準(zhǔn)后的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)進(jìn)行處理,生成語(yǔ)音參考信號(hào);阻塞矩陣模...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:陳日林,馮大航,陳孝良,常樂(lè),
申請(qǐng)(專(zhuān)利權(quán))人:北京聲智科技有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:北京;11
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。