The invention discloses a speech enhancement hearing aid method, which comprises the following steps: step (A), Multi-channel Speech decomposition; step (B), sub-band gain adjustment; step (C), speech enhancement hearing aid network construction; step (D), speech compensation output: sub-band signal input step (C) model training after step (B) gain adjustment in deep learning network. The compensated speech signal is generated and output. The speech enhancement hearing aid method of the present invention can improve the problem that the traditional method can not suppress the noise with the same distribution as the speech, and solve the technical problems of the speech enhancement hearing aid method in the prior art, such as poor robustness of speech compensation, low efficiency of speech compensation and difficulty in meeting the needs of patients, and has a good application prospect.
【技術實現步驟摘要】
一種言語增強助聽方法
本專利技術涉及音頻信號處理
,具體涉及一種言語增強助聽方法。
技術介紹
聽力損失會嚴重影響聽障患者的身心健康,佩戴助聽器是目前聽障患者改善聽力最有效的手段。隨著人工智能領域的發展,基于語音信號的人機交互技術逐步成為研究熱點之一。在人機交互過程中,語音不可避免的受到各種環境的影響,會引入各種各樣的干擾信息。環境噪聲的復雜性以及噪聲與語音間可能存在的強相關性,都使得提高噪聲環境下聽障患者的語音理解度存在很多挑戰。語音增強技術是改善人耳在噪聲環境下的感知能力的主要手段之一,其主要出發點是從含噪的原始語音信號中盡可能地恢復出純凈的輸入語音,從而提高原始輸入語音的聽覺質量,降低人耳的疲勞感,進而提高語言可懂度。因此,大量學者針對如何從交疊的含噪信號中提取目標語音的問題進行了深入的研究,也提出了很多有效的方案,包括譜減法及其改進算法、統計模型法、子空間法和神經網絡四個分支。但是,目前上述的言語增強助聽方法,主要關注在降噪方面,對于聽障患者來說,由于聽力損失的個性化,在降噪的同時還需要對語音信號進行針對性的增益補償。而且,有效的補償還需要減少噪聲的干擾,否則,過多的放大噪聲會嚴重影響患者的言語理解度。此外,當語音和噪聲同時發生且頻率范圍相同時,還沒有非常有效的方法能將它們分離,因此語音降噪算法的研究工作具有很大的挑戰性。由此可見,上述現有的言語增強助聽方法,存在有不便與缺陷,而亟待加以進一步改進。因此,如何解決言語增強助聽方法存在的問題,是當前急需解決的問題。
技術實現思路
本專利技術的目的是解決現有的言語增強助聽方法,存在有不便與缺陷。本專利技 ...
【技術保護點】
1.一種言語增強助聽方法,其特征在于:包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,并利用數據庫對深度學習網絡進行模型訓練;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。
【技術特征摘要】
1.一種言語增強助聽方法,其特征在于:包括以下步驟,步驟(A),多通道語音分解:將輸入的語音信號進行多通道分解,分解成子帶信號;步驟(B),子帶增益調整:根據聽障患者的聽力圖,對各子帶信號進行增益調整;步驟(C),言語增強助聽網絡構建:構建包含患者的個性信息、聽力圖、不同噪聲環境下的輸入語音信號、期望補償后的語音數據庫,并按照編碼層、解碼層、輸出層和注意層結構構建深度學習網絡,并利用數據庫對深度學習網絡進行模型訓練;步驟(D),語音補償輸出:將步驟(B)中進行增益調整后的子帶信號輸入步驟(C)模型訓練后的深度學習網絡中,生出補償后的語音信號,并進行輸出。2.根據權利要求1所述的一種言語增強助聽方法,其特征在于:步驟(A),多通道語音分解,包括以下步驟,(A1),根據人耳的伽馬通刻度來設定32個子帶濾波器的中心頻率;(A2),根據聽損患者的聽力圖,將隨頻率的變化趨勢對響度值相等或波動小且低于波動閾值的連續頻帶進行合并;(A3),將均勻余弦調制濾波器組的相鄰通道,根據(A2)的合并規則進行合并,生成所需非均勻濾波器組;(A4)將輸入的語音信號通過(A3)所述的非均勻濾波器組,生成分解后的子帶信號。3.根據權利要求2所述的一種言語增強助聽方法,其特征在于:所述波動閾值為5dB。4.根據權利要求1所述的一種言語增強助聽方法,其特征在于:步驟(B),根據聽障患者的聽力圖,對各子帶信號進行增益調整,具體為將初始的增益補償量設為為聽障患...
【專利技術屬性】
技術研發人員:梁瑞宇,包永強,王青云,謝躍,唐閨臣,馮月芹,
申請(專利權)人:南京工程學院,
類型:發明
國別省市:江蘇,32
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。