本申請提供一種可配置水聲信號特征提取方法及裝置,方法包括:獲取配置文件以及水聲采樣信號;對水聲采樣信號執行預處理以得到第一信號幀集;根據配置文件對第一信號幀集執行快速傅里葉變換FFT以得到水聲信號特征;根據配置文件輸出水聲信號特征。其中,配置文件用于指示待提取的LOFAR譜、STFT功率譜、Mel功率譜和MFCC中的一個或多個水聲信號特征組合。裝置包括控制模塊、FPGA模塊和電源模塊,FPGA模塊中,通過四種特征提取方法共用預處理單元以及FFT單元,不僅實現多種結果的水聲信號特征提取,還可根據需要選擇合適的水聲信號特征,減少硬件資源的使用。而且在運算過程中,減少乘法器的使用,提高運算效率。提高運算效率。提高運算效率。
【技術實現步驟摘要】
一種可配置水聲信號特征提取方法及裝置
[0001]本申請涉及聲紋特征提取
,尤其涉及一種可配置水聲信號特征提取方法及裝置。
技術介紹
[0002]水聲目標識別是水聲領域的研究熱點之一,在對水聲目標識別的研究中,需要對水聲信號特征進行提取。水聲信號特征提取方法主要包括時域波形結構分析、頻域譜估計以及時頻域分析。頻域譜估計可提取信號的頻率、功率、包絡等特征,以及利用高階譜分析非高斯信號的特征。這類方法原理簡單、易于實現,僅通過采集到的原始水聲信號即可獲得,但是提取的特征需要一定的經驗知識進行信號預處理,在時變的海洋環境下泛化性較弱。通過頻域譜估計得到的頻譜特征,由原來的傅里葉頻譜、功率譜不斷豐富擴展,發展到低頻率分析記錄(Low Frequency Analysis and Recording,LOFAR)譜,聽覺譜,梅爾Mel頻率倒譜等,越來越契合人耳的聽覺感知模型。
[0003]上述水聲信號特征提取,大多數通過軟件方法實現,常用的是使用librosa庫來進行特征提取,librosa是一個Python模塊,用于分析一般的音頻信號,是一個強大的python語音信號處理的第三方庫。調用librosa庫,可以加載音頻文件,讀取采樣率,并且librosa庫也提供了短時傅里葉變換(Short Time Fourier Transform,STFT)、梅爾頻率倒譜系數(Mel Frequency Cepstral Coefficents,MFCC)等特征提取工具。但是librosa提供的庫并不能看到源代碼,且通過一種編程形式,只能提取一種水聲信號特征,提取結果單一。
技術實現思路
[0004]本申請提供一種可配置水聲信號特征提取方法及裝置,以解決采用軟件方法提取水聲信號特征時,提取結果單一的問題。
[0005]本申請第一方面提供一種可配置水聲信號特征提取方法,所述方法包括:獲取配置文件以及水聲采樣信號;對所述水聲采樣信號執行預處理,以得到第一信號幀集;所述預處理包括預加重處理、分幀處理和加窗處理;根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征;所述配置文件用于指示待提取的低頻率分析記錄LOFAR譜、短時傅里葉變換STFT功率譜、梅爾Mel功率譜和梅爾頻率倒譜系數MFCC中的一個或多個水聲信號特征組合;輸出所述水聲信號特征。
[0006]可選的,對所述水聲采樣信號執行預處理包括:利用預加重濾波器加強所述水聲采樣信號中的高頻部分,以對所述水聲采樣信號進行預加重處理;將所述水聲采樣信號分割成多個時幀,以進行分幀處理;將分幀處理后的所述水聲采樣信號的每一幀乘以窗口函數,以進行加窗處理。
[0007]可選的,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟包括:對所述第一信號幀集的每一幀進行歸一化處理,以得到第二信號幀集;對所述第二信號幀集的每一幀進行中心化處理,以得到第三信號幀集;對所述第三信號幀集執行快速傅里葉變換FFT,以得到所述低頻率分析記錄LOFAR譜。
[0008]可選的,對所述第一信號幀集的每一幀進行歸一化處理的步驟包括:獲取所述第一信號幀集中每一幀信號的第一振幅極值,所述第一振幅極值包括最大值和最小值;根據所述第一振幅極值對所述第一信號幀集的每一幀信號求平均值,以得到所述第二信號幀集。
[0009]可選的,對所述第二信號幀集的每一幀進行中心化處理的步驟包括:獲取所述第二信號幀集中每一幀信號的第二振幅極值,所述第二振幅極值包括最大值和最小值;根據所述第二振幅極值對所述第二信號幀集的每一幀信號求平均值;將所述第二信號幀集中的每一幀信號振幅與每一幀信號振幅的所述平均值相減,以得到所述第三信號幀集。
[0010]可選的,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟還包括:將所述第一信號幀集的每一幀進行快速傅里葉變換FFT;對變換后的所述第一信號幀集的每一幀進行功率譜計算,以得到所述短時傅里葉變換STFT功率譜。
[0011]可選的,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟還包括:對每一幀的所述短時傅里葉變換STFT功率譜通過梅爾濾波器組進行梅爾Mel濾波,以得到濾波后的功率譜;將所述濾波后的功率譜與所述梅爾濾波器組相乘,以得到多個能量數值結果;將多個所述能量數值結果分別取對數,以得到所述梅爾Mel功率譜。
[0012]可選的,對每一幀的所述短時傅里葉變換STFT功率譜通過梅爾濾波器組進行梅爾Mel濾波的步驟包括:獲取功率譜計算后的水聲采樣信號的最低頻率、最高頻率和梅爾濾波器的個數;分別計算所述最高頻率和所述最低頻率對應的梅爾Mel頻率;根據所述梅爾濾波器的個數計算相鄰兩個所述梅爾濾波器的中心頻率間距;分別計算多個所述中心頻率間距對應的頻率值,以及多個所述頻率值對應的快速傅里葉變換FFT中點的下標,所述中點為所述梅爾濾波器三角形底邊的中點。
[0013]可選的,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟還包括:將得到的所述梅爾Mel功率譜進行離散余弦變換DCT處理,以得到所述梅爾頻率倒譜系數MFCC;所述離散余弦變換DCT的點數與所述梅爾濾波器的個數相同。
[0014]本申請另一方面提供一種可配置水聲信號特征提取裝置,所述裝置包括:控制模塊、可編程邏輯門陣列FPGA模塊和電源模塊;其中,所述電源模塊分別與所述控制模塊、所述FPGA模塊電性相連;所述控制模塊與所述可編程邏輯門陣列FPGA模塊通信相連;所述控制模塊內設置有存儲單元;所述可編程邏輯門陣列FPGA模塊包括預處理單元、歸一化中心化單元、快速傅里葉變換FFT單元、短時傅里葉變換STFT功率譜計算單元、梅爾濾波器組單元、對數計算單元、梅爾Mel功率譜單元、離散余弦變換DCT單元和梅爾頻率倒譜系數MFCC單元;所述控制模塊被配置為執行上述第一方面所述的可配置水聲信號特征提取方法。
[0015]由以上技術方案可知,本申請一方面提供一種可配置水聲信號特征提取方法,所述方法包括:獲取配置文件以及水聲采樣信號;對所述水聲采樣信號執行預處理,以得到第一信號幀集;根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征;再根據配置文件輸出水聲信號特征。其中,配置文件用于指示待提取的低頻率分析記錄LOFAR譜、短時傅里葉變換STFT功率譜、梅爾Mel功率譜和梅爾頻率倒譜系數MFCC中的一個或多個水聲信號特征組合。本申請另一方面提供一種可配置水聲信號特征提取裝置,所述裝置包括控制模塊、FPGA模塊和電源模塊,在FPGA模塊中,四種特征提取方法共用預處理單元以及FFT單元,不僅可實現多種結果的水聲信號特征提取,還可減少硬件資源的使用。通過在運算過程中減少乘法器的使用,還可降低運算的復雜度,提高運算效率。
附圖說明
[0016]為了更清楚地說明本申請的技術方案,下面將對實施例中所需要使用的附本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種可配置水聲信號特征提取方法,其特征在于,包括:獲取配置文件以及水聲采樣信號;對所述水聲采樣信號執行預處理,以得到第一信號幀集;所述預處理包括預加重處理、分幀處理和加窗處理;根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征;所述配置文件用于指示待提取的低頻率分析記錄LOFAR譜、短時傅里葉變換STFT功率譜、梅爾Mel功率譜和梅爾頻率倒譜系數MFCC中的一個或多個水聲信號特征組合;輸出所述水聲信號特征。2.根據權利要求1所述的一種可配置水聲信號特征提取方法,其特征在于,對所述水聲采樣信號執行預處理包括:利用預加重濾波器加強所述水聲采樣信號中的高頻部分,以對所述水聲采樣信號進行預加重處理;將所述水聲采樣信號分割成多個時幀,以進行分幀處理;將分幀處理后的所述水聲采樣信號的每一幀乘以窗口函數,以進行加窗處理。3.根據權利要求1所述的一種可配置水聲信號特征提取方法,其特征在于,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟包括:對所述第一信號幀集的每一幀進行歸一化處理,以得到第二信號幀集;對所述第二信號幀集的每一幀進行中心化處理,以得到第三信號幀集;對所述第三信號幀集執行快速傅里葉變換FFT,以得到所述低頻率分析記錄LOFAR譜。4.根據權利要求3所述的一種可配置水聲信號特征提取方法,其特征在于,對所述第一信號幀集的每一幀進行歸一化處理的步驟包括:獲取所述第一信號幀集中每一幀信號的第一振幅極值,所述第一振幅極值包括最大值和最小值;根據所述第一振幅極值對所述第一信號幀集的每一幀信號求平均值,以得到所述第二信號幀集。5.根據權利要求4所述的一種可配置水聲信號特征提取方法,其特征在于,對所述第二信號幀集的每一幀進行中心化處理的步驟包括:獲取所述第二信號幀集中每一幀信號的第二振幅極值,所述第二振幅極值包括最大值和最小值;根據所述第二振幅極值對所述第二信號幀集的每一幀信號求平均值;將所述第二信號幀集中的每一幀信號振幅與每一幀信號振幅的所述平均值相減,以得到所述第三信號幀集。6.根據權利要求1所述的一種可配置水聲信號特征提取方法,其特征在于,根據所述配置文件對所述第一信號幀集執行快速傅里葉變換FFT,以得到水聲信號特征的步驟還包括:將所述第一信號幀集的每一...
【專利技術屬性】
技術研發人員:林軍,史可,王中風,
申請(專利權)人:南京大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。