本發明專利技術公開了一種語音信號增強系統和方法,方法包括如下步驟:將輸入信號通過自適應濾波器進行濾波得到語音參考信號,利用阻塞矩陣對輸入信號進行噪聲提取處理,得到噪聲參考信號;將噪聲參考信號和語音參考信號通過多通道維納濾波進行濾波得到降噪語音信號;根據噪聲參考信號對降噪語音信號進行語音增強處理,得到增強語音信號和語音存在概率信號;根據語音存在概率信號對自適應匹配濾波器的濾波系數、阻塞矩陣、多通道維納濾波器的濾波系數和學習步長進行更新。本發明專利技術在麥克風陣列比較簡單的情況下,很好地克服在實際應用環境下對目標源實時跟蹤的收斂不能保證、速度慢和實時增強失真大等問題。
【技術實現步驟摘要】
本專利技術屬于信號處理
,具體涉及語音信號的增強處理,特別是一種語音增強系統和方法。
技術介紹
語音增強是指當語音信號被各種各樣的噪聲干擾后,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術。語音增強的一個主要目標是從帶噪語音信號中提取盡可能純凈的原始語音,改進語音質量。隨著數字信號處理理論成熟和硬件計算能力的大幅提升,使得基于麥克風陣列語音增強性能和實時性得以保證。傳統的廣義旁瓣消除語音增強法必須已知準確的目標源方位角,用線性預測的方式對噪聲抑制。其缺點是難以滿足目標源方位角未知或目標源移動的情況,廣義旁瓣消除 方法信號失真較大,并且用傳統的NLMS自適應濾波方法收斂速度慢。傳統的多通道維納濾波在平穩噪聲環境下較廣義旁瓣消除的信號失真較小,但是對于復雜環境下的目標源活性檢測誤差較大,信號失真也較大。傳統的單通道語音幅度譜估計在平穩噪聲環境下,能較為準確的估計噪聲功率譜密度,但是在非平穩噪聲情況下,噪聲估計誤差較大,會造成嚴重的音樂噪聲和信號失真。如今大多數使用麥克風陣列語音增強的設備主要是基于指向型麥克風,即將有向麥克對準目標源,然后經過簡單的處理。因此這類設備需要已知目標源的位置,且不能對目標源做實時跟蹤。在實際應用環境下,噪聲和干擾的情況往往比較復雜,并且如果目標源存在移動情況,會對目標源尤其是移動目標源的跟蹤和增強產生巨大的影響,其結果是使現有的語音增強系統和方法所涉及的一些濾波器系數更新算法難以收斂,處理后得到結果相對于真實的信號源存在大量的失真。而現有的在這些方面表現較好的語音增強系統和方法,往往對麥克風陣列中麥克風的數量和布局有特定的要求。
技術實現思路
(一 )要解決的技術問題本專利技術所述解決的技術問題是現有的語音增強系統和方法在實際應用環境下進行語音信號處理時,對目標源實時跟蹤以及對目標源實時增強性能不佳的問題。(二)技術方案為解決上述技術問題,本專利技術提出一種語音信號增強系統,用于對包含目標語音信號的輸入信號進行增強,所述目標語音信號由目標源發出,該系統包括目標源跟蹤模塊、噪聲自適應模塊、多通道維納濾波模塊和語音幅度譜估計模塊,其中輸入信號分別連接到目標源跟蹤模塊和噪聲自適應模塊,所述目標源跟蹤模塊用于對輸入信號進行濾波,得到一個語音參考信號;所述噪聲自適應模塊用于對輸入信號進行處理,消去目標源成分,得到一個噪聲參考信號;所述多通道維納濾波模塊用于接收所述語音參考信號和所述噪聲參考信號,并利用所述噪聲參考信號對所述語音參考信號進行濾波,得到一個降噪語音信號;所述語音幅度譜估計模塊用于接收所述降噪語音信號和所述噪聲參考信號,并根據所述噪聲參考信號對所述降噪語音信號進行語音增強處理,得到一個語音增強信號和一個語音存在概率信號,并將所述語音存在概率信號反饋到所述目標源跟蹤模塊、噪聲自適應模塊和多通道維納濾波模塊,以對目標源跟蹤模塊、噪聲自適應模塊和多通道維納濾波模塊的參數進行實時調節。本專利技術還提出一種語音信號增強方法,用于對包含目標語音信號的輸入信號進行增強,所述目標語音信號由目標源發出,該方法包括如下步驟Si、將所述輸入信號通過一個自適應濾波器進行濾波得到一個語音參考信號,利用阻塞矩陣對所述輸入信號進行噪聲提取處理,得到一個噪聲參考信號;S2、將所述噪聲參考信號和所述語音參考信號通過一個多通道維納濾波進行濾波得到一個降噪語音信號;S3、根據所述噪聲參考信號對所述降噪語音信號進行語音增強處理,得到一個增強語音信號和一個語音存在概率信號;S4、根據語音存在概率信號對所述自適應匹配濾波器的濾波系數、阻塞矩陣、多通道維納濾波器的濾波系數和學習步長進行更新。(三)有益效果·本專利技術的系統和方法可以在麥克風陣列比較簡單的情況下,很好地克服在實際應用環境下對目標源實時跟蹤的收斂不能保證、速度慢和實時增強失真大等問題。首先,在實際干擾和噪聲較為復雜的應用環境下能夠進行實時語音信號處理,能夠對目標源尤其是移動目標源進行很好地跟蹤并進行實時增強。其次,本專利技術所采用的方法對麥克風陣列本身沒有太大要求,并且對目標源的先驗知識要求比較少,對目標源的行為(主要指移動和是否處于活動狀態)要求也不算嚴格,所以使得本專利技術應用范圍比較廣泛。再次,本專利技術是基于ASIO音頻驅動進行設計和實現的,實時數據的輸入和輸出的延遲非常小,使本專利技術能夠適應數據延遲性要求較高的應用場合,增強了本專利技術的實用性。最后,在本專利技術下的應用時,如果針對不同的應用環境有針對性地選擇麥克風陣列,本專利技術的處理效果會更加優越。附圖說明圖I是本專利技術的語音增強系統的結構框圖;圖2和圖3是本專利技術不能處理的特殊情況的不意圖;圖4為本專利技術進行實驗驗證時的實驗布局示意圖。具體實施例方式為使本專利技術的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本專利技術作進一步的詳細說明。本專利技術的語音增強系統和該語音增強系統所采用的方法是從實際應用環境出發,根據實際應用環境進行研究的。本專利技術使用的實驗數據都是在實際場景下錄制得到的,理論結合實驗,得到了大體的處理方法框架。同時為了達到本專利技術能夠實時運行的目的,我們不僅考慮了運行效果,而且把運算速率作為另一個重要的因素放入本專利技術的研究中,使得本專利技術能同時兼顧運行效果和運算速度。基于以上考慮,專利技術人對于本專利技術進行了進一步的完善,最后得到本專利技術的語音增強系統和方法。圖I是本專利技術的語音增強系統的結構框圖。如圖I所示,本專利技術的語音增強系統主要由目標源跟蹤模塊、噪聲自適應模塊、多通道維納濾波模塊和語音幅度譜估計模塊四個模塊組成,輸入信號分別連接到目標源跟蹤模塊和噪聲自適應模塊。目標源跟蹤模塊用于對輸入信號進行濾波,得到目標語音參考信號;噪聲自適應模塊用于對輸入信號進行處理,消去目標源成分,得到噪聲參考信號。所述輸入信號包含目標語音信號,所述目標語音信號由目標源發出。本專利技術的創新點在于根據實際環境的特性,經過反復實驗,確定用這四個模塊組成本專利技術的信號增強系統的基本架構。本專利技術的四個模塊主要涉及傳統的廣義旁瓣消除、多通道維納濾波、以及語音幅度譜估計三個技術環節。我們將這些技術環節進行修改并整合到本專利技術的模塊中,使這些模塊能夠有機地結合起來,產生良好的處理效果,以達到實用 的目的。目標源跟蹤模塊和噪聲自適應模塊是本專利技術的系統的關鍵所在,本專利技術能夠根據輸入信號的信噪比將輸入信號判定為純噪聲和帶噪信號。純噪聲中不含有目標源成分,帶噪信號含有需要提取的目標成分以及噪聲成分。根據本專利技術的一個具體實施例,所述目標源跟蹤模塊可由一個濾波器實現,該濾波器的濾波系數可以實時更新;并且,所述噪聲自適應模塊利用一個阻塞矩陣消去輸入信號中的目標源成分,從而得到噪聲參考信號。繼續參照圖1,所述語音參考信號和噪聲參考信號均輸入到所述多通道維納濾波模塊,該多通道維納濾波模塊利用噪聲參考信號對語音參考信號進行濾波,得到一個降噪語音信號。根據本專利技術的該實施例,該多通道維納濾波模塊可以由計算量很小的基于最小均方誤差準則的自適應濾波器實現。所述降噪語音信號和所述噪聲參考信號均輸入到所述語音幅度譜估計模塊,所述語音幅度譜估計模塊根據所述噪聲參考信號對所述降噪語音信號進行語音增強處理,得到一個語音增強信號和一個語音存在概率信號。根據本專利技術的該實施例,所述語音幅本文檔來自技高網...
【技術保護點】
一種語音信號增強系統,用于對包含目標語音信號的輸入信號進行增強,所述目標語音信號由目標源發出,其特征在于,該系統包括目標源跟蹤模塊、噪聲自適應模塊、多通道維納濾波模塊和語音幅度譜估計模塊,其中輸入信號分別連接到目標源跟蹤模塊和噪聲自適應模塊,所述目標源跟蹤模塊用于對輸入信號進行濾波,得到一個語音參考信號;所述噪聲自適應模塊用于對輸入信號進行處理,消去目標源成分,得到一個噪聲參考信號;所述多通道維納濾波模塊用于接收所述語音參考信號和所述噪聲參考信號,并利用所述噪聲參考信號對所述語音參考信號進行濾波,得到一個降噪語音信號;所述語音幅度譜估計模塊用于接收所述降噪語音信號和所述噪聲參考信號,并根據所述噪聲參考信號對所述降噪語音信號進行語音增強處理,得到一個語音增強信號和一個語音存在概率信號,并將所述語音存在概率信號反饋到所述目標源跟蹤模塊、噪聲自適應模塊和多通道維納濾波模塊,以對目標源跟蹤模塊、噪聲自適應模塊和多通道維納濾波模塊的參數進行實時調節。
【技術特征摘要】
【專利技術屬性】
技術研發人員:張寧,馬峰,戴禮榮,凌震華,
申請(專利權)人:中國科學技術大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。