• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種言語增強助聽方法技術

    技術編號:20007109 閱讀:38 留言:0更新日期:2019-01-05 18:41
    本發明專利技術公開了一種言語增強助聽方法,包括以下步驟,步驟(A),多通道語音分解;步驟(B),子帶增益調整;步驟(C),言語增強助聽網絡構建;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。本發明專利技術的言語增強助聽方法,可以改善傳統方法無法抑制與語音同分布噪聲的問題,還解決現有技術中言語增強助聽方法言語補償的魯棒性差、言語補償效率低下,難以滿足患者需求的技術問題,具有良好的應用前景。

    A Speech Enhancement Hearing Aid Method

    The invention discloses a speech enhancement hearing aid method, which comprises the following steps: step (A), Multi-channel Speech decomposition; step (B), sub-band gain adjustment; step (C), speech enhancement hearing aid network construction; step (D), speech compensation output: sub-band signal input step (C) model training after step (B) gain adjustment in deep learning network. The compensated speech signal is generated and output. The speech enhancement hearing aid method of the present invention can improve the problem that the traditional method can not suppress the noise with the same distribution as the speech, and solve the technical problems of the speech enhancement hearing aid method in the prior art, such as poor robustness of speech compensation, low efficiency of speech compensation and difficulty in meeting the needs of patients, and has a good application prospect.

    【技術實現步驟摘要】
    一種言語增強助聽方法
    本專利技術涉及音頻信號處理
    ,具體涉及一種言語增強助聽方法。
    技術介紹
    聽力損失會嚴重影響聽障患者的身心健康,佩戴助聽器是目前聽障患者改善聽力最有效的手段。隨著人工智能領域的發展,基于語音信號的人機交互技術逐步成為研究熱點之一。在人機交互過程中,語音不可避免的受到各種環境的影響,會引入各種各樣的干擾信息。環境噪聲的復雜性以及噪聲與語音間可能存在的強相關性,都使得提高噪聲環境下聽障患者的語音理解度存在很多挑戰。語音增強技術是改善人耳在噪聲環境下的感知能力的主要手段之一,其主要出發點是從含噪的原始語音信號中盡可能地恢復出純凈的輸入語音,從而提高原始輸入語音的聽覺質量,降低人耳的疲勞感,進而提高語言可懂度。因此,大量學者針對如何從交疊的含噪信號中提取目標語音的問題進行了深入的研究,也提出了很多有效的方案,包括譜減法及其改進算法、統計模型法、子空間法和神經網絡四個分支。但是,目前上述的言語增強助聽方法,主要關注在降噪方面,對于聽障患者來說,由于聽力損失的個性化,在降噪的同時還需要對語音信號進行針對性的增益補償。而且,有效的補償還需要減少噪聲的干擾,否則,過多的放大噪聲會嚴重影響患者的言語理解度。此外,當語音和噪聲同時發生且頻率范圍相同時,還沒有非常有效的方法能將它們分離,因此語音降噪算法的研究工作具有很大的挑戰性。由此可見,上述現有的言語增強助聽方法,存在有不便與缺陷,而亟待加以進一步改進。因此,如何解決言語增強助聽方法存在的問題,是當前急需解決的問題。
    技術實現思路
    本專利技術的目的是解決現有的言語增強助聽方法,存在有不便與缺陷。本專利技術的言語增強助聽方法,可以改善傳統方法無法抑制與語音同分布噪聲的問題,還解決現有技術中言語增強助聽方法言語補償的魯棒性差、言語補償效率低下,難以滿足患者需求的技術問題,具有良好的應用前景。為了達到上述目的,本專利技術所采用的技術方案是:一種言語增強助聽方法,包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,并利用數據庫對深度學習網絡進行模型訓練;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。前述的一種言語增強助聽方法,步驟(A),多通道語音分解,包括以下步驟,(A1),根據人耳的伽馬通刻度來設定32個子帶濾波器的中心頻率;(A2),根據聽損患者的聽力圖,將隨頻率的變化趨勢對響度值相等或波動小且低于波動閾值的連續頻帶進行合并;(A3),將均勻余弦調制濾波器組的相鄰通道,根據(A2)的合并規則進行合并,生成所需非均勻濾波器組;(A4)將輸入的語音信號通過(A3)所述的非均勻濾波器組,生成分解后的子帶信號。前述的一種言語增強助聽方法,所述波動閾值為5dB。前述的一種言語增強助聽方法,步驟(B),根據聽障患者的聽力圖,對各子帶信號進行增益調整,具體為將初始的增益補償量設為為聽障患者聽力損失的一半。前述的一種言語增強助聽方法,步驟(C),并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,所述解碼層包含兩層卷積長短期記憶網絡,所述輸出層為一層卷積長短期記憶網絡,所述注意層為一層卷積長短期記憶網絡,所述編碼層包含兩層卷積長短期記憶網絡,其中,第二層卷積長短期記憶網絡的輸出與輸出層的輸出一起通過注意層生成一組權重,將該組權重作用于不同的子帶信號通道。前述的一種言語增強助聽方法,所述卷積長短期記憶學習單元,由智能調節器、輸出控制、細胞更新處理、激活函數、乘法器組成,當前時刻t的輸出都受到前一時刻t-1的細胞狀態和隱層狀態的影響,所述卷積長短期記憶學習單元,表達式如式(1)所示,其中,Gt是智能調節器輸出針對候選細胞狀態與前一時刻細胞狀態的加權值,通過softmax將一組向量映射成另一組取值在0-1之間的常數,并獲得相應的概率值,其中sigmoid函數表示將一組向量映射成一個取值在0-1之間的常數;為當前時刻狀態信息的候選值;Ct和Ct-1為t時刻和t-1時刻的細胞狀態;ot是當前輸出控制量;ht和ht-1為t時刻和t-1時刻的隱層狀態輸出;與ot的計算中均采用卷積操作,用來挖掘多通道數據內在關系;Wa、與Wo分別為智能調節器、狀態信息和輸出控制門的權值,與bo分別代表狀態信息和輸出控制門的偏置;xt和xt-1分別為t時刻和t-1時刻的輸入。本專利技術的有益效果是:本專利技術的基于深度學習網絡的助聽器自驗配方法,引入卷積長短期記憶網絡,將言語增強和增益補償融為一體,顯著提高了言語增強效果;在深度學習網絡中引入注意力模型,結合補償輸出信號和隱層信息動態的調整輸入語音前端增益,提高了言語補償的個性化效果;通過構建完備的數據庫來訓練深度學習網絡,可以改善傳統方法無法抑制與語音同分布噪聲的問題,還解決現有技術中言語增強助聽方法言語補償的魯棒性差、言語補償效率低下,難以滿足患者需求的技術問題,具有良好的應用前景。附圖說明圖1是本專利技術的基于深度學習網絡的助聽器自驗配方法的流程圖;圖2是本專利技術的多通道語音濾波器組的系統框圖;圖3是本專利技術的卷積長短期記憶學習單元的系統框圖;圖4是針對正常聽力者下的不同方法的語音增強效果對比的示意圖。具體實施方式下面將結合說明書附圖,對本專利技術作進一步的說明。如圖1所示,本專利技術的言語增強助聽方法,包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號,包括以下步驟,(A1),根據人耳的伽馬通刻度來設定32個子帶濾波器的中心頻率;(A2),根據聽損患者的聽力圖,將隨頻率的變化趨勢對響度值相等或波動小且低于波動閾值的連續頻帶進行合并,優選的波動閾值為5dB;(A3),將均勻余弦調制濾波器組的相鄰通道,根據(A2)的合并規則進行合并,生成所需非均勻濾波器組;(A4)將輸入信號通過(A3)所述的非均勻濾波器組,生成分解后的子帶信號。如圖2所示為多通道語音濾波器組,圖中分析濾波器組為Hk(z),(k=0,1,...,M-1),綜合濾波器組為Fk(z),(k=0,1,...,M-1),輸入信號x(n)經分析濾波器組后被分解成一系列子帶信號yi(n),yi(n)經過編碼、壓縮、傳輸等處理后由綜合濾波器組重構出信號Hk(z)的作用一方面是將x(n)分成M個子帶信號,另一方面是作為抽取前的抗混疊濾波器。Fk(z)的作用一方面將信號重建,另一方面是作為插值后的去除映像濾波器,內插器和抽取器用于改變采樣速率,去除冗余信息,信號傳輸速率降低,也能實現數據壓縮;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整,具體為將初始的增益補償量設為為聽障患者聽力損失的一半;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層和輸出層結構構建深度學習網絡,并利用數據庫對深度本文檔來自技高網...

    【技術保護點】
    1.一種言語增強助聽方法,其特征在于:包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,并利用數據庫對深度學習網絡進行模型訓練;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。

    【技術特征摘要】
    1.一種言語增強助聽方法,其特征在于:包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,并利用數據庫對深度學習網絡進行模型訓練;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。2.根據權利要求1所述的一種言語增強助聽方法,其特征在于:步驟(A),多通道語音分解,包括以下步驟,(A1),根據人耳的伽馬通刻度來設定32個子帶濾波器的中心頻率;(A2),根據聽損患者的聽力圖,將隨頻率的變化趨勢對響度值相等或波動小且低于波動閾值的連續頻帶進行合并;(A3),將均勻余弦調制濾波器組的相鄰通道,根據(A2)的合并規則進行合并,生成所需非均勻濾波器組;(A4)將輸入的語音信號通過(A3)所述的非均勻濾波器組,生成分解后的子帶信號。3.根據權利要求2所述的一種言語增強助聽方法,其特征在于:所述波動閾值為5dB。4.根據權利要求1所述的一種言語增強助聽方法,其特征在于:步驟(B),根據聽障患者的聽力圖,對各子帶信號進行增益調整,具體為將初始的增益補償量設為為聽障患...

    【專利技術屬性】
    技術研發人員:梁瑞宇包永強王青云謝躍唐閨臣馮月芹
    申請(專利權)人:南京工程學院
    類型:發明
    國別省市:江蘇,32

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 少妇人妻偷人精品无码视频| 久久亚洲精品中文字幕无码| 人妻无码久久精品| 精品人妻无码专区在中文字幕| 人妻中文无码久热丝袜| 亚洲AV中文无码乱人伦下载 | 无码精品尤物一区二区三区| 日韩免费a级毛片无码a∨| 自慰无码一区二区三区| 日韩加勒比一本无码精品| 久久久久亚洲AV无码永不| 亚洲Av无码乱码在线播放| 97久久精品无码一区二区| 一区二区三区无码视频免费福利 | 国产日韩AV免费无码一区二区三区| 亚洲AV无码久久精品色欲| 中文字幕无码av激情不卡| 无码人妻丰满熟妇区毛片18| 久久精品aⅴ无码中文字字幕不卡| 丝袜无码一区二区三区| 99久无码中文字幕一本久道| 久久久久亚洲av无码专区| 无码欧精品亚洲日韩一区| 中文字幕无码精品三级在线电影| 内射中出无码护士在线| 极品无码国模国产在线观看| 亚洲熟妇无码八V在线播放| 18精品久久久无码午夜福利| 日木av无码专区亚洲av毛片| 午夜无码伦费影视在线观看| 野花在线无码视频在线播放 | 国产精品无码成人午夜电影| 国产成人无码精品一区在线观看| 无码毛片一区二区三区中文字幕 | 亚洲成AV人片在线观看无码| 日韩精品无码视频一区二区蜜桃 | HEYZO无码综合国产精品| 无码熟熟妇丰满人妻啪啪软件| 亚洲AV成人无码久久WWW| 国产精品亚洲专区无码唯爱网| 成人无码Av片在线观看|