用于視頻電話會議的虛擬聲音定位制造技術

技術編號：36653670 閱讀：24 留言：0更新日期：2023-02-18 13:17

本公開提供用于視頻會議的方法、設備以及系統。本實現方式更具體地涉及能夠用于識別視頻會議中的說話者的音頻信號處理技術。在一些方面中，音頻信號處理器可以將視頻會議中的每個說話者映射到相應空間方向，并且使用與說話者所映射到的空間方向關聯的一個或多個傳遞函數來使從每個說話者接收的音頻信號變換。音頻信號處理器可以進一步將經變換的音頻信號傳送到音頻輸出設備，音頻輸出設備發射具有與變換關聯的定向性的聲波。例如，音頻信號處理器可以將一個或多個頭部相關傳遞函數應用于從特定說話者接收的音頻信號，使得由音頻輸出設備發射的聲波被感知為源自說話者所映射到的空間方向。的空間方向。的空間方向。

全部詳細技術資料下載

【技術實現步驟摘要】
用于視頻電話會議的虛擬聲音定位
[0001]對相關申請的交叉引用本申請根據35 USC
?§?
119（e）而要求提交于2021年8月4日的美國臨時專利申請No. 63/203,941的優先權和權益，該臨時專利申請通過引用而以其整體并入于本文中。

[0002]目前的實現方式一般涉及電話會議，并且具體地涉及用于視頻電話會議的虛擬聲音定位。

技術介紹

[0003]視頻電話會議（也被稱為“視頻會議”）是允許兩個或更多個人從不同地點接近實時地看到彼此且聽到彼此的通信技術。視頻會議能夠通過從多個參與者傳送和接收視頻信號和音頻信號的設備或終端的網絡來建立。例如，每個終端一般至少包括用以捕獲用戶的視頻的照相機、用以從用戶捕獲音頻的麥克風、用以回放其他參與者的所捕獲的視頻的顯示部件以及用以回放從其他參與者捕獲的音頻的音頻輸出部件。
[0004]視頻會議技術上的進步已導致具有越來越多數量的參與者的更大規模的視頻會議。然而，在許多視頻會議中，在任何給定時間，可能僅一個（或幾個）參與者（也被稱為“說話者”）正在說話。隨著視頻會議中的參與者的數量增加，（一個或多個）說話者的身份可能變得模糊。換言之，參與具有大量的參與者的視頻會議的用戶可能具有在任何給定時間辨別所述參與者中的哪個參與者正在說話的困難。因而，需要改進與視頻會議關聯的用戶體驗。

技術實現思路

[0005]提供本
技術實現思路
，以按簡化形式介紹在下文中在具體實施方式中進一步描述的概念的選擇。本
技術實現思路
不旨在識別要求保護的主題的關鍵特...

【技術保護點】

【技術特征摘要】
1.一種處理音頻信號的方法，包括：接收與包括多個參與者的視頻會議關聯的第一音頻信號；檢測與所述第一音頻信號關聯的第一說話者，所述第一說話者是所述視頻會議中的所述多個參與者中的一個參與者；將所述第一說話者映射到第一空間方向；基于與所述第一空間方向關聯的一個或多個傳遞函數而使所述第一音頻信號變換；以及將經變換的第一音頻信號傳送到音頻輸出設備。2.根據權利要求1所述的方法，其中所述第一說話者到所述第一空間方向的映射包括：確定所述第一說話者在與所述視頻會議關聯的顯示器上的位置，所述第一說話者的所述位置與所述第一空間方向關聯。3.根據權利要求2所述的方法，其中所述第一說話者的所述位置的確定包括：接收指示所述多個參與者中的每個參與者在所述顯示器上的相對位置的位置信息。4.根據權利要求2所述的方法，其中所述第一說話者的所述位置的確定包括：接收與所述視頻會議關聯的視頻幀，所述第一說話者的所述位置至少部分地基于所接收的視頻幀而確定。5. 根據權利要求1所述的方法，其中與所述第一音頻信號關聯的所述第一說話者的檢測包括：接收與所述視頻會議關聯的視頻幀；以及對所接收的視頻幀執行識別與所述第一音頻信號關聯的所述第一說話者的圖像處理操作。6.根據權利要求1所述的方法，其中所述一個或多個傳遞函數包括使得由所述音頻輸出設備發射的聲波被感知為源自所述第一空間方向的頭部相關傳遞函數（HRTF）。7.根據權利要求1所述的方法，其中所述一個或多個傳遞函數包括與所述音頻輸出設備的左音頻通道關聯的第一傳遞函數和與所述音頻輸出設備的右音頻通道關聯的第二傳遞函數，所述第一傳遞函數不同于所述第二傳遞函數。8. 根據權利要求1所述的方法，進一步包括：接收與所述第一音頻信號關聯的反饋；以及基于所接收的反饋而調整所述一個或多個傳遞函數。9.根據權利要求1所述的方法，進一步包括：接收與所述視頻會議關聯的第二音頻信號；檢測與所述第二音頻信號關聯的第二說話者，所述第二說話者是所述多個參與者中的與所述第一說話者不同的一個參與者；將所述第二說話者映射到與所述第一空間方向不同的第二空間方向；基于與所述第二空間方向關聯的一個或多個傳遞函數而使所述第二音頻信號變換；以及將經變換的第二音頻信號傳送到所述音頻輸出設備。10. 一種視頻會議系統，包括：處理系統；以及
存儲器，其存儲指令，所述指令在由所述處理系統執行時，使得所述視頻會議系統：接收與包括多個參與者的視頻會議關聯的第一音頻信號；檢測與所述第一音頻信號關聯的第一說話者，所述第一說話者是所述視頻會議中的所述多個參與者中的一個參與者；將所述第一說話者映射到第一空間方向；基于與所述第一空間方向關聯的一個或多個傳遞函數而使所述第一音頻信號變換；以及將經變換的第一音頻信號傳送到音頻輸出設備。11.根據權利要求10所述的視頻會議系統，其中所述第一說話者到所述第一空間方向的映射包括：確...

【專利技術屬性】
技術研發人員：A，
申請(專利權)人：DSP集團有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術