【技術實現步驟摘要】
測量內容一致性的方法和設備
本專利技術一般涉及音頻信號處理。更具體地,本專利技術的實施例涉及用于測量音頻部分之間的內容一致性的方法和設備,以及用于測量音頻分段之間的內容相似度的方法和設備。
技術介紹
內容一致性度量用于測量音頻信號內或音頻信號間的內容一致性。該度量涉及計算兩個音頻分段之間的內容一致性(contentcoherence)(內容相似度(contentsimilarity)或內容一致性(contentconsistence)),并用作判斷這些分段是否屬于相同的語義聚類或這兩個分段之間是否存在真實的邊界的基礎。已經提出了測量兩個長窗口之間的內容一致性的方法。根據這種方法,將每個長窗口劃分為多個短音頻分段(音頻元素),并且基于交疊相似度鏈接的整體思路,通過計算從左窗口和右窗口獲得的所有分段對之間的語義相似性而獲得內容一致性度量。可通過測量音頻分段之間的內容相似度或通過其對應的音頻元素類來計算語義相似性(例如,參見L.Lu及A.Hanjalic.“Text-LikeSegmentationofGeneralAudioforContent-BasedRetrieval,”IEEETrans.onMultimedia,vol.11,no.4,658-669,2009,其通過引用合并于此以用于全部目的)。可以基于兩個音頻分段之間的特征比較來計算內容相似度。已經提出了諸如K-L散度(Kullback-Leiblerdivergence,KLD)的各種度量,以測量兩個音頻分段之間的內容相似度。這一部分描述的方案是可能請求保護的方案,而不一定是先前已構思或已請求保 ...
【技術保護點】
一種測量第一音頻部分與第二音頻部分之間的內容一致性的方法,包括:針對所述第一音頻部分中的每個音頻分段,確定所述第二音頻部分中預定數目的音頻分段,其中所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第一音頻部分中的該音頻分段與所述第二音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;以及將第一內容一致性計算為,針對所述第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。
【技術特征摘要】
1.一種測量第一音頻部分與第二音頻部分之間的內容一致性的方法,包括:針對所述第一音頻部分中的每個音頻分段,確定所述第二音頻部分中預定數目的音頻分段,其中所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第一音頻部分中的該音頻分段與所述第二音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;以及將第一內容一致性計算為,針對所述第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。2.根據權利要求1所述的方法,進一步包括:針對所述第二音頻部分中的每個音頻分段,確定所述第一音頻部分中預定數目的音頻分段,其中所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第二音頻部分中的該音頻分段與所述第一音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;將第二內容一致性計算為針對所述第二音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值;基于所述第一內容一致性和所述第二內容一致性計算對稱內容一致性。3.根據權利要求1或2所述的方法,其中,將所述第一音頻部分中的音頻分段si,l與所確定的音頻分段sj,r之間的內容相似度S(si,l,sj,r)中的每一個計算為所述第一音頻部分中的序列[si,l,…,si+L-1,l]與所述第二音頻部分中的序列[sj,r,…,sj+L-1,r]之間的內容相似度,L>1。4.根據權利要求3所述的方法,其中,通過應用動態時間規整方案或動態規劃方案來計算所述序列之間的內容相似度。5.根據權利要求1或2所述的方法,其中,通過以下步驟來計算兩個音頻分段之間的內容相似度:從所述音頻分段中提取第一特征向量;根據所述特征向量生成用于計算所述內容相似度的統計模型;以及基于所生成的統計模型計算所述內容相似度,其中所述第一特征向量中的每一個中的所有特征值都是非負的且所述特征值的和為1,并且所述統計模型基于狄里克雷分布。6.根據權利要求5所述的方法,其中,所述提取包括:從所述音頻分段中提取第二特征向量;以及針對所述第二特征向量中的每一個,計算用于測量該第二特征向量與參考向量中的每一個之間的關系的量,其中與所述第二特征向量相對應的所有量形成所述第一特征向量中的一個。7.根據權利要求6所述的方法,其中,通過以下方法之一確定所述參考向量:隨機產生法,其中隨機生成所述參考向量;無監督聚類法,其中提取自訓練樣本的訓練向量被分組為聚類,并計算所述參考向量以分別代表所述聚類;監督建模法,其中根據提取自訓練樣本的訓練向量來人工定義和學習所述參考向量;以及特征分解法,其中將所述參考向量計算為以提取自訓練樣本的訓練向量作為行的矩陣的特征向量。8.根據權利要求6所述的方法,其中,通過以下各量之一測量所述第二特征向量與所述參考向量中的每一個之間的關系:所述第二特征向量與該參考向量之間的距離;所述第二特征向量與該參考向量之間的相關;所述第二特征向量與該參考向量之間的內積;以及該參考向量的以所述第二特征向量作為相關證據的后驗概率。9.一種用于測量第一音頻部分與第二音頻部分之間的內容一致性的設備,包括:相似度計算器,其針對所述第一音頻...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。