The invention relates to an algorithm for extracting features of denoising frequency based on mutation limited Boltzmann machine, belonging to the field of audio signal processing technology. The invention maps the collected audio signal from the input value of the high-dimensional visual layer to the low-dimensional hidden layer by using the strong unsupervised learning ability of Boltzmann machine, and uses a small amount of label information to realize clustering and grouping of the low-dimensional characteristic data by using the probability that the audio characteristic signal appears is larger than the noise characteristic signal, thus achieving the purpose of extracting the denoising feature of the audio signal. The invention has strong anti-interference ability, low requirement for the length of the audio signal processed, simple algorithm, and one-time processing of denoising, feature extraction and dimension reduction of the audio signal. The programming is easy to realize, and has strong stability and robustness for the actual audio signal processing.
【技術實現步驟摘要】
一種基于變異受限玻爾茲曼機的去噪音頻特征提取算法
本專利技術涉及一種基于變異受限玻爾茲曼機的去噪音頻特征提取算法,屬于音頻特征信號處理
技術介紹
現有的音頻特征提取大多是對音頻信號特征系數的提取,如線性預測系數(LPC)、線性預測倒譜系數(LPCC)、梅爾頻率倒譜系數(MFCC)等,這些特征提取方法要么是對于音頻信號直接進行系數特征提取,提取出的特征參數也需進行降維處理才可用于音頻分類或音頻識別中,一系列的處理流程使得整個音頻信號處理過程花費了大量的時間。本文中所提出的算法利用受限玻爾茲曼機強大的無監督學習能力和貝葉斯相關知識實現了對不定長音頻信號的去噪特征提取,其間也實現了降維處理。并且受限玻爾茲曼機對于大數據處理具有強大的穩定性和魯棒性。
技術實現思路
本專利技術是利用受限玻爾茲曼機強大的無監督學習能力,將不定長音頻信號作為模型的輸入,通過權值閾值計算映射到低維的隱含層空間。因為有用音頻特征信號出現的概率要大于噪聲特征信號的概率,故利用其特性通過閾值函數和標簽信息對對隱空間的特征參數進行聚類分組。其間在對模型進行訓練過程中為了更快更高校的求取模型的閾值和權值引入了變異算子即以一定概率接受較差解,從而也避免了尋優過程陷入局部最優的問題。本算法理論簡單,適用于現在的大規模音頻數據處理,對現目前的音頻特征提取算法提供了一種新的思路,在實現特征提取時候同時進行了音頻信號的去噪和降維處理,其算法也可用于人工智能的音頻識別等相關領域。本專利技術的技術方案為:一種基于變異受限玻爾茲曼機的去噪音頻特征提取算法,該方法具體包括以下步驟:(1)音頻信號采集:采集音頻 ...
【技術保護點】
1.一種基于變異受限玻爾茲曼機的去噪音頻特征提取算法,其特征在于:具體步驟如下:(1)音頻信號采集:采集音頻信號,獲得音頻樣本;(2)信號預處理:將采集的音頻信號進行分組,分別為訓練組合測試組;(3)受限去噪玻爾茲曼機模型的搭建:利用受限玻爾茲曼機構建學習模型,在學習模型的權值閾值求解過程中引入變異因子獲得變異的受限玻爾茲曼機模型即受限去噪玻爾茲曼機模型,模型分為可視層、隱含層以及標簽層;(4)去噪音頻特征模型訓練:首先利用音頻特征出現的概率總大于噪聲特征出現的概率實現對變異受限玻爾茲曼機模型的隱含層分成兩組,得到混合結構的變異受限玻爾茲曼機模型,然后以混合結構的變異受限玻爾茲曼機對訓練組的高斯超向量的音頻特征和噪聲特征進行分別建模和訓練以獲得去噪音頻特征信號;(5)音頻特征信號的對比檢驗:將測試組送入搭建好的受限去噪玻爾茲曼機模型中,將訓練組所獲得的特征值與本次測試數據所獲得的特征值進行相似度計算進而判斷特征提取與聚類結果的準確性。
【技術特征摘要】
1.一種基于變異受限玻爾茲曼機的去噪音頻特征提取算法,其特征在于:具體步驟如下:(1)音頻信號采集:采集音頻信號,獲得音頻樣本;(2)信號預處理:將采集的音頻信號進行分組,分別為訓練組合測試組;(3)受限去噪玻爾茲曼機模型的搭建:利用受限玻爾茲曼機構建學習模型,在學習模型的權值閾值求解過程中引入變異因子獲得變異的受限玻爾茲曼機模型即受限去噪玻爾茲曼機模型,模型分為可視層、隱含層以及標簽層;(4)去噪音頻特征模型訓練:首先利用音頻特征出現的概率總大于噪聲特征出現的概率實現對變異受限玻爾茲曼機模型的隱含層分成兩組,得到混合結構的變異受限玻爾茲曼機模型,然后以混合結構的變異受限玻爾茲曼機對訓練組的高斯超向量的音頻特征和噪聲特征進行分別建模和訓練以獲得去噪音頻特征信號;(5)音頻特征信號的對比檢驗:將測試組送入搭建好的受限去噪玻爾茲曼機模型中,將訓練組所獲得的特征值與本次測試數據所獲得的特征值進行相似度計算進而判斷特征提取與聚類結果的準確性。2.根據權利要求1所述的基于變異受限玻爾茲曼機的去噪音頻特征提取算法,其特征在于:所述音頻信號采集時需要設置好聲道模式、采樣頻率以及量化間隔,其中采樣頻率應滿足奈奎斯特采樣定理,即采樣頻率應大于等于2倍采樣信號的最高頻率,獲取得到為數字信號x(n)。3.根據權利要求1所述的基于變異受限玻爾茲曼機的去噪音頻特征提取算法,其特征在于:所述信號預處理將采集好的音頻信號進行讀取出并進行分組,分為訓練組x1和測試組x2,訓練組用于訓練模型參數,測試組用于檢驗訓練出的模型結果如何。4.根據權利要求1所述的基于變異受限玻爾茲曼機的去噪音頻特征提取算法,其特征在于:所述受限去噪玻爾茲曼機模型的搭建包括以下步驟:(1)模型搭建首先定義T為隱含層低維空間,F為特征維數,C為混合高斯數,高斯超向量是由高斯的均值向量與總體差異構成,對于一段音頻信號可由如下高斯超向量表示:M=x+Tw其中x表示與說話人和信道無關的音頻超向量,由通用背景模型的高斯均值向量構成,為整個高斯超向量空間的中心;T為低維空間CFχR的載荷矩陣即總體差異空間,R為總體差異因子個數;w為服從標準正太分布的隨機向量即總體差異因子;對于超向量M其均值為x,協方差為TTT,T和w可通過期望最大化得到估計值。(2)將受限玻爾茲曼模型看做是一種能量模型并用概率測度進行求解,其可視層與隱含層之間的系統能量函數定義為如下表達式:E(v,h)=-vTWh-bTv-aTh其中v可視層即本文中的高斯超向量M;h為隱含層即本文所需的低維特征向量;W為層間權值;b為正向網絡閾值;a為反向網絡閾值,基于受限玻爾茲曼模型的能量函數進一步定義可視層與隱含層直接的聯合概率分布:其中Z為歸一化因子又稱分配函數,其表達式如下:在深度神經網絡的訓練過程中,可見層單元服從貝努力分布或者高斯分布,隱含層單元服從貝努力分布,由于受限玻爾茲曼模型...
【專利技術屬性】
技術研發人員:龍華,楊明亮,宋耀蓮,
申請(專利權)人:昆明理工大學,
類型:發明
國別省市:云南,53
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。