• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    測量內容一致性的方法和設備、測量相似度的方法和設備技術

    技術編號:8387593 閱讀:213 留言:0更新日期:2013-03-07 08:16
    描述了用于測量內容一致性的實施例和用于測量內容相似度的實施例。測量第一音頻部分與第二音頻部分之間的內容一致性。針對第一音頻部分中的每個音頻分段,確定第二音頻部分中預定數目的音頻分段。第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于該音頻分段與第二音頻部分中的所有其它音頻分段之間的內容相似度。計算第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值。將內容一致性計算為,針對第一音頻部分中的各音頻分段而計算的各平均值的平均值、最大值或最小值。可以基于狄里克雷分布計算內容相似度。

    【技術實現步驟摘要】
    測量內容一致性的方法和設備
    本專利技術一般涉及音頻信號處理。更具體地,本專利技術的實施例涉及用于測量音頻部分之間的內容一致性的方法和設備,以及用于測量音頻分段之間的內容相似度的方法和設備。
    技術介紹
    內容一致性度量用于測量音頻信號內或音頻信號間的內容一致性。該度量涉及計算兩個音頻分段之間的內容一致性(contentcoherence)(內容相似度(contentsimilarity)或內容一致性(contentconsistence)),并用作判斷這些分段是否屬于相同的語義聚類或這兩個分段之間是否存在真實的邊界的基礎。已經提出了測量兩個長窗口之間的內容一致性的方法。根據這種方法,將每個長窗口劃分為多個短音頻分段(音頻元素),并且基于交疊相似度鏈接的整體思路,通過計算從左窗口和右窗口獲得的所有分段對之間的語義相似性而獲得內容一致性度量。可通過測量音頻分段之間的內容相似度或通過其對應的音頻元素類來計算語義相似性(例如,參見L.Lu及A.Hanjalic.“Text-LikeSegmentationofGeneralAudioforContent-BasedRetrieval,”IEEETrans.onMultimedia,vol.11,no.4,658-669,2009,其通過引用合并于此以用于全部目的)。可以基于兩個音頻分段之間的特征比較來計算內容相似度。已經提出了諸如K-L散度(Kullback-Leiblerdivergence,KLD)的各種度量,以測量兩個音頻分段之間的內容相似度。這一部分描述的方案是可能請求保護的方案,而不一定是先前已構思或已請求保護的方案。因此,除非另行表明,否則不應只是由于這些方案被包括在這一部分中就假定這一部分中描述的任何方案只能作為現有技術。類似地,除非另行表明,否則不應基于這一部分而假定任何現有技術中已經意識到相對于一個或多個方案而確定的問題。
    技術實現思路
    根據本專利技術一個實施例,提供一種測量第一音頻部分與第二音頻部分之間的內容一致性的方法。針對第一音頻部分中的每個音頻分段,確定第二音頻部分中預定數目的音頻分段。第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于第一音頻部分中的該音頻分段與第二音頻部分中的所有其它音頻分段之間的內容相似度。計算第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值。將第一內容一致性計算為,針對第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。根據本專利技術一個實施例,提供一種用于測量第一音頻部分與第二音頻部分之間的內容一致性的設備。設備包含相似度計算器和一致性計算器。針對第一音頻部分中的每個音頻分段,相似度計算器確定第二音頻部分中預定數目的音頻分段。第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于第一音頻部分中的該音頻分段與第二音頻部分中的所有其它音頻分段之間的內容相似度。相似度計算器也計算第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值。一致性計算器將第一內容一致性計算為,針對第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。根據本專利技術一個實施例,提供一種測量兩個音頻分段之間的內容相似度的方法。從所述音頻分段中提取第一特征向量。第一特征向量中的每一個中的所有特征值都是非負的并被歸一化,使得特征值的和為1。根據特征向量,基于狄里克雷分布生成用于計算內容相似度的統計模型。基于所生成的統計模型計算內容相似度。根據本專利技術一個實施例,提供一種用于測量兩個音頻分段之間的內容相似度的設備。設備包含特征生成器、模型生成器和相似度計算器。特征生成器從音頻分段中提取第一特征向量。第一特征向量中的每一個中的所有特征值都是非負的并被歸一化,使得特征值的和為1。模型生成器根據特征向量,基于狄里克雷分布生成用于計算內容相似度的統計模型。相似度計算器基于所生成的統計模型計算內容相似度。下面參考附圖描述本專利技術的進一步特征及優點以及本專利技術各個實施例的結構及操作。應注意,本專利技術不限于在此描述的具體實施例。在此呈現這些實施例僅用于說明性目的。基于這里包含的教導,對本領域技術人員而言,另外的實施例將是明顯的。附圖說明在附圖的各圖中通過示例來圖解本專利技術,但這些示例不對本專利技術產生限制,附圖中類似的附圖標記表示類似的元件,其中:圖1是圖示根據本專利技術實施例的用于測量內容一致性的示例設備的框圖;圖2是用于圖示第一音頻部分中的音頻分段與第二音頻部分中的音頻分段的子集之間的內容相似度的示意圖;圖3是圖示根據本專利技術實施例的測量內容一致性的示例方法的流程圖;圖4是圖示根據圖3方法的進一步實施例的測量內容一致性的示例方法的流程圖;圖5是圖示根據本專利技術實施例的相似度計算器的示例的框圖;圖6是用于圖示通過采用統計模型來計算內容相似度的示例方法的流程圖;圖7是圖示用于實施本專利技術的各實施例的示例性系統的框圖。具體實施方式下面參考附圖描述本專利技術實施例。應注意,為清楚起見,在附圖和描述中省略了關于本領域技術人員已知但是對理解本專利技術而言并非必需的組件和過程的陳述和描述。本領域的技術人員可以理解,本專利技術的各方面可以被實施為系統(例如在線數字媒體商店、云計算服務、流媒體服務、電信網絡等)、裝置(例如蜂窩電話、便攜媒體播放器、個人計算機、電視機頂盒、或數字錄像機、或任意其它媒體播放器)、方法或計算機程序產品。因此,本專利技術的各方面可以采取以下形式:完全硬件實施例、完全軟件實施例(包括固件、駐留軟件、微代碼等)或組合軟件部分與硬件部分的實施例,本文可以一般地稱之為“電路”、“模塊”或“系統”。此外,本專利技術的各方面可以采取體現為一個或多個計算機可讀介質的計算機程序產品的形式,該計算機可讀介質上體現有計算機可讀程序代碼。可以使用一個或多個計算機可讀介質的任何組合。計算機可讀介質可以是計算機可讀信號介質或計算機可讀存儲介質。計算機可讀存儲介質例如可以是(但不限于)電的、磁的、光的、電磁的、紅外線的、或半導體的系統、設備或裝置、或前述各項的任何適當的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括以下:有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPROM或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD-ROM)、光存儲裝置、磁存儲裝置、或前述各項的任何適當的組合。在本文語境中,計算機可讀存儲介質可以是任何含有或存儲供指令執行系統、設備或裝置使用的或與指令執行系統、設備或裝置相聯系的程序的有形介質。計算機可讀信號介質可以包括例如在基帶中或作為載波的一部分傳播的、其中帶有計算機可讀程序代碼的數據信號。這樣的傳播信號可以采取任何適當的形式,包括但不限于電磁的、光的或其任何適當的組合。計算機可讀信號介質可以是不同于計算機可讀存儲介質的、能夠傳達、傳播或傳輸供指令執行系統、設備或裝置使用的或與指令執行系統、設備或裝置相聯系的程序的任何一種計算機可讀介質。體現在計算機可讀介質中的程序代碼可以采用任何適當的介質傳輸,包括但不限于無線、有線、光纜、射頻等等、或上述各項的任何適當的組合。用于執行本專利技術各方面的操作的計算機程序代碼可以以一種或多種程序設計語言的任本文檔來自技高網
    ...
    <a  title="測量內容一致性的方法和設備、測量相似度的方法和設備原文來自X技術">測量內容一致性的方法和設備、測量相似度的方法和設備</a>

    【技術保護點】
    一種測量第一音頻部分與第二音頻部分之間的內容一致性的方法,包括:針對所述第一音頻部分中的每個音頻分段,確定所述第二音頻部分中預定數目的音頻分段,其中所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第一音頻部分中的該音頻分段與所述第二音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;以及將第一內容一致性計算為,針對所述第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。

    【技術特征摘要】
    1.一種測量第一音頻部分與第二音頻部分之間的內容一致性的方法,包括:針對所述第一音頻部分中的每個音頻分段,確定所述第二音頻部分中預定數目的音頻分段,其中所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第一音頻部分中的該音頻分段與所述第二音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;以及將第一內容一致性計算為,針對所述第一音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值。2.根據權利要求1所述的方法,進一步包括:針對所述第二音頻部分中的每個音頻分段,確定所述第一音頻部分中預定數目的音頻分段,其中所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度高于所述第二音頻部分中的該音頻分段與所述第一音頻部分中的所有其它音頻分段之間的內容相似度;以及計算所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內容相似度的平均值;將第二內容一致性計算為針對所述第二音頻部分中的各音頻分段而計算的各平均值的平均值、最小值或最大值;基于所述第一內容一致性和所述第二內容一致性計算對稱內容一致性。3.根據權利要求1或2所述的方法,其中,將所述第一音頻部分中的音頻分段si,l與所確定的音頻分段sj,r之間的內容相似度S(si,l,sj,r)中的每一個計算為所述第一音頻部分中的序列[si,l,…,si+L-1,l]與所述第二音頻部分中的序列[sj,r,…,sj+L-1,r]之間的內容相似度,L>1。4.根據權利要求3所述的方法,其中,通過應用動態時間規整方案或動態規劃方案來計算所述序列之間的內容相似度。5.根據權利要求1或2所述的方法,其中,通過以下步驟來計算兩個音頻分段之間的內容相似度:從所述音頻分段中提取第一特征向量;根據所述特征向量生成用于計算所述內容相似度的統計模型;以及基于所生成的統計模型計算所述內容相似度,其中所述第一特征向量中的每一個中的所有特征值都是非負的且所述特征值的和為1,并且所述統計模型基于狄里克雷分布。6.根據權利要求5所述的方法,其中,所述提取包括:從所述音頻分段中提取第二特征向量;以及針對所述第二特征向量中的每一個,計算用于測量該第二特征向量與參考向量中的每一個之間的關系的量,其中與所述第二特征向量相對應的所有量形成所述第一特征向量中的一個。7.根據權利要求6所述的方法,其中,通過以下方法之一確定所述參考向量:隨機產生法,其中隨機生成所述參考向量;無監督聚類法,其中提取自訓練樣本的訓練向量被分組為聚類,并計算所述參考向量以分別代表所述聚類;監督建模法,其中根據提取自訓練樣本的訓練向量來人工定義和學習所述參考向量;以及特征分解法,其中將所述參考向量計算為以提取自訓練樣本的訓練向量作為行的矩陣的特征向量。8.根據權利要求6所述的方法,其中,通過以下各量之一測量所述第二特征向量與所述參考向量中的每一個之間的關系:所述第二特征向量與該參考向量之間的距離;所述第二特征向量與該參考向量之間的相關;所述第二特征向量與該參考向量之間的內積;以及該參考向量的以所述第二特征向量作為相關證據的后驗概率。9.一種用于測量第一音頻部分與第二音頻部分之間的內容一致性的設備,包括:相似度計算器,其針對所述第一音頻...

    【專利技術屬性】
    技術研發人員:蘆烈胡明清
    申請(專利權)人:杜比實驗室特許公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV日韩AV永久无码绿巨人 | 亚洲AV无码一区二区三区牛牛| 国产成人无码a区在线观看视频免费| 99久无码中文字幕一本久道| 久久综合一区二区无码| 亚洲av中文无码乱人伦在线r▽ | 精品无人区无码乱码毛片国产| 亚洲第一极品精品无码久久| 无码人妻精品一二三区免费| 亚洲av日韩av无码| 爽到高潮无码视频在线观看| 亚洲精品自偷自拍无码| 亚洲大尺度无码无码专区| 亚洲?V无码成人精品区日韩 | 小12箩利洗澡无码视频网站| 亚洲VA中文字幕无码毛片| 人妻丝袜无码专区视频网站| 亚洲日韩精品无码AV海量| 国产乱子伦精品无码码专区| 亚洲AV无码专区日韩| 精品国产性色无码AV网站| 无码AV片在线观看免费| 无码午夜人妻一区二区三区不卡视频| 无码精品蜜桃一区二区三区WW | 免费无码午夜福利片69| 亚洲a无码综合a国产av中文| 一夲道dvd高清无码| 久久久久亚洲精品无码蜜桃| 少妇人妻偷人精品无码视频新浪| 国产色无码精品视频免费| 久久久久无码专区亚洲av| 永久免费无码日韩视频| 人妻系列无码专区久久五月天| 特级无码a级毛片特黄| 无码人妻一区二区三区免费视频| 蜜臀AV无码一区二区三区| 无码国产精品一区二区高潮| 人妻无码久久中文字幕专区| 国产无码网页在线观看| 亚洲永久无码3D动漫一区| 日韩精品专区AV无码|