The embodiment of the present invention provides a method and device for adjusting the volume of music. The method includes: acquiring the time-domain waveform of the music to be played and the time-domain waveform of the noise of the playing environment; using the pre-trained neural network according to the time-domain waveform of the music to be played and the time-domain waveform of the noise, obtaining the volume setting of the music to be played; and using the volume setting to adjust the volume of the music to be played. Thus, the embodiments of the present invention can automatically adjust the volume of the music to be played by the pre-trained neural network including the music style neural network, the noise category identification neural network and the volume adjustment neural network, which takes into account the factors affecting the user's current volume preference, such as the noise category and the music style of the environment, and so on. It simplifies the user's operation and improves the user experience.
【技術實現步驟摘要】
對音樂進行音量調節的方法及設備
本專利技術實施例涉及聲音領域,并且更具體地,涉及一種對音樂進行音量調節的方法及設備。
技術介紹
音質是人對音頻質量的主觀評價。一般地音質被劃分成幾十個指標,音量(loudness)也稱為響度,是其中一項重要的指標。音量的大小會影響人對音樂信息的接收質量。音量的設置一般與環境音有關,例如在嘈雜的環境中的音樂音量一般高于在安靜的環境中的音樂音量。目前的音量的設置主要是由用戶自己調節的,這樣給用戶帶來了操作復雜度,影響了用戶的體驗。另外現存的一些自動音量調節技術,一般只考慮了環境噪聲參數,因此音量自動調節能力有限,實際上個人用戶對音量的偏好與很多因素有關,如音樂的類別,人們聽不同風格類型音樂時,可能會設置不同的音量,不同類型的環境噪聲也會對音量設置造成不同的影響,其他的因素還有個人的偏好和個人的聽力、音頻播放設備參數等,音量模型必須全面考慮這些因素才能達到更好的性能。
技術實現思路
本專利技術實施例提供了一種對音樂的音量進行自動調節的方法及設備,可以基于深度學習實現對音樂的音量進行調節,簡化了用戶操作,從而提升了用戶的體驗。第一方面,提供了一種對音樂進行音量調節的方法,包括:獲取待播放音樂的時域波形以及播放環境的噪聲的時域波形;根據所述待播放音樂的時域波形以及所述噪聲的時域波形,使用預先訓練好的神經網絡,得到所述待播放音樂的音量設置;使用所述音量設置調節所述待播放音樂的音量。在本專利技術的一種實現方式中,還包括:將所述預先訓練好的神經網絡作為基線模型;重復執行以下步驟,直到特定用戶的再次調節指令的次數小于預設值:對在播放音樂,使用所述 ...
【技術保護點】
1.一種對音樂進行音量調節的方法,其特征在于,包括:獲取待播放音樂的時域波形以及播放環境的噪聲的時域波形;根據所述待播放音樂的時域波形以及所述噪聲的時域波形,使用預先訓練好的神經網絡,得到所述待播放音樂的音量設置;使用所述音量設置調節所述待播放音樂的音量。
【技術特征摘要】
1.一種對音樂進行音量調節的方法,其特征在于,包括:獲取待播放音樂的時域波形以及播放環境的噪聲的時域波形;根據所述待播放音樂的時域波形以及所述噪聲的時域波形,使用預先訓練好的神經網絡,得到所述待播放音樂的音量設置;使用所述音量設置調節所述待播放音樂的音量。2.根據權利要求1所述的方法,其特征在于,還包括:將所述預先訓練好的神經網絡作為基線模型;重復執行以下步驟,直到特定用戶的再次調節指令的次數小于預設值:對在播放音樂,使用所述基線模型得到相應的音量設置;獲取所述特定用戶對所述相應的音量設置的再次調節指令;若所述特定用戶的再次調節指令的次數達到預設值,則將所述特定用戶調節后的音量作為訓練樣本,在所述基線模型的參數基礎上進行學習,得到更新后的模型,并用所述更新后的模型替換基線模型。3.根據權利要求1所述的方法,其特征在于,所述預先訓練好的神經網絡包括:音樂風格神經網絡、噪聲類別辨識神經網絡以及音量調節神經網絡。4.根據權利要求3所述的方法,其特征在于,所述得到所述待播放音樂的音量設置的過程包括:根據所述待播放音樂的時域波形,使用所述音樂風格神經網絡,得到所述待播放音樂的風格向量;根據所述噪聲的時域波形,使用所述噪聲類別辨識神經網絡,得到所述噪聲的類別;根據所述待播放音樂的時域波形得到所述待播放音樂的能量特征;根據所述噪聲的時域波形得到所述噪聲的能量特征;將所述待播放音樂的風格向量、所述噪聲的類別、所述待播放音樂的能量特征、所述噪聲的能量特征輸入至所述音量調節神經網絡,得到所述待播放音樂的音量設置。5.根據權利要求4所述的方法,其特征在于,得到所述待播放音樂的風格向量的過程包括:對所述待播放音樂的時域波形進行分幀,并對分幀后的每幀進行特征提取,得到所述待播放音樂的特征;將所述待播放音樂的特征輸入至所述音樂風格神經網絡,得到所述該待播放音樂的風格向量。6.根據權利要求4所述的方法,其特征在于,得到所述噪聲的類別的過程包括:對所述噪聲的時域波形進行分幀,并對分幀后的每幀進行特征提取,得到所述噪聲的特征;將所述噪聲的特征輸入至所述噪聲類別辨識神經網絡,得到所述噪聲的類別。7.根據權利要求4所述的方法,其特征在于,所述待播放音樂的能量特征包括所述待播放音樂的平均幅度,得到所述待播放音樂的能量特征的過程包括:計算所述待播...
【專利技術屬性】
技術研發人員:姚青山,秦宇,喻浩文,盧峰,
申請(專利權)人:安克創新科技股份有限公司,
類型:發明
國別省市:湖南,43
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。