本發明專利技術公開了多媒體文件搜索方法及裝置,其中,所述方法包括:獲取多媒體文件的文本輔助信息文件,所述文本輔助信息文件中保存有多媒體文件的文本內容以及對應的時間點信息;基于所述文本輔助信息文件中的文本內容為所述多媒體文件建立索引;當接收到搜索關鍵詞時,獲取包含有所述搜索關鍵詞的第一目標文本輔助信息文件,并確定出所述搜索關鍵詞在所述第一目標文本輔助信息文件中所在位置處的時間值;根據所述第一目標文本輔助信息文件確定對應的第一目標多媒體文件,并返回所述第一目標多媒體文件中對應時間值處的相關信息。通過本發明專利技術,能夠實現對多媒體文件的全文搜索。
【技術實現步驟摘要】
本專利技術涉及搜索
,特別是涉及多媒體文件搜索方法及裝置。
技術介紹
隨著因特網的普及,大量的信息迅速累積并被廣泛使用。因此,時空距離不再是人們存取與使用信息的最大障礙,取而代之的問題是缺乏有效率的方式在浩瀚的因特網中尋找想要的信息。信息檢索技術因為能夠提供使用者便捷的方式存取和使用想要的信息,因此近些年來格外受到重視。直到現在為止,大部分信息檢索的研究都是以文字性的查詢指令去檢索文字形式的信息為主,也就是做文字與文件間的比對。但是,目前,傳統文字形式之外的影音多媒體信息如廣播、電視節目、視頻等,大量地出現在因特網上,顯然已成為文字信息 之外非常重要的信息來源。但是,在絕大部分情況下,語音是這些多媒體信息最主要的組成部分,因此,起初對于多媒體文件的檢索一般僅限于文件名的檢索。例如,以某多媒體文件的文件名作為查詢詞進行搜索時,一般可以返回完整的多媒體文件,或者相關的評論信息坐坐寸寸ο然而在實際應用中,人們有時候僅需要查看某多媒體文件中的某個片段,此時,在現有技術下,一般只能先找到該多媒體文件,然后憑記憶確定出想要看的片段的大概位置,再在視頻中一段一段的查找,直到聽到對應的對白或者看到對應的字幕,才能確定找到了目標片段。整個查找過程非常繁瑣,并且用戶經過一段時間的查找之后也不一定能找到想要的片段,浪費了時間。
技術實現思路
本專利技術提供了多媒體文件搜索方法及裝置,能夠實現對多媒體文件的全文搜索。本專利技術提供了如下方案一種多媒體文件搜索方法,包括獲取多媒體文件的文本輔助信息文件,所述文本輔助信息文件中保存有多媒體文件的文本內容以及對應的時間點信息;基于所述文本輔助信息文件中的文本內容為所述多媒體文件建立索引;當接收到搜索關鍵詞時,獲取包含有所述搜索關鍵詞的第一目標文本輔助信息文件,并確定出所述搜索關鍵詞在所述第一目標文本輔助信息文件中所在位置處的時間值;根據所述第一目標文本輔助信息文件確定對應的第一目標多媒體文件,并返回所述第一目標多媒體文件中對應時間值處的相關信息。可選地,所述返回所述第一目標多媒體文件中對應時間值處的相關信息包括返回所述第一目標多媒體文件及其屬性值、目標文本輔助信息文件中包含所述搜索關鍵詞的文本內容及其對應的時間值。可選地,所述返回所述第一目標多媒體文件中對應時間值處的相關信息包括返回所述第一目標多媒體文件中對應時間值處預置時間段內的文件片段。可選地,所述多媒體文件包括視頻文件,所述返回所述第一目標多媒體文件中對應時間值處的相關信息包括返回所述第一目標多媒體文件中對應時間值處的視頻截圖。可選地,還包括當接收到搜索關鍵詞時,通過查詢預置的語義相關詞語數據庫,獲取與所述搜索關鍵詞語義相關的相關關鍵詞;獲取包含有所述相關關鍵詞的第二目標文本輔助信息文件,并確定出所述相關關鍵詞在所述第二目標文本輔助信息文件中所在位置處的時間值;根據所述第二目標文本輔助信息文件確定對應的第二目標多媒體文件,并返回所述第二目標多媒體文件中對應時間值處的相關信息。可選地,所述獲取多媒體文件的文本輔助信息文件包括從預置的文本輔助信息文件資源庫中,為各個多媒體文件選擇匹配的文本輔助信息文件。一種多媒體文件搜索裝置,包括文本輔助信息文件獲取單元,用于獲取多媒體文件的文本輔助信息文件,所述文本輔助信息文件中保存有多媒體文件的文本內容以及對應的時間點信息;索引建立單元,用于基于所述文本輔助信息文件中的文本內容為所述多媒體文件建立索引;第一搜索單元,用于當接收到搜索關鍵詞時,獲取包含有所述搜索關鍵詞的第一目標文本輔助信息文件,并確定出所述搜索關鍵詞在所述第一目標文本輔助信息文件中所在位置處的時間值;第一信息返回單元,用于根據所述第一目標文本輔助信息文件確定對應的第一目標多媒體文件,并返回所述第一目標多媒體文件中對應時間值處的相關信息。可選地,所述第一信息返回單元包括文本信息返回子單元,用于返回所述第一目標多媒體文件及其屬性值、目標文本輔助信息文件中包含所述關鍵詞的文本內容及其對應的時間值。可選地,所述第一信息返回單元包括文件片段返回子單元,用于返回所述第一目標多媒體文件中對應時間值處預置時間段內的文件片段。可選地,所述多媒體文件包括視頻文件,所述第一信息返回單元包括視頻截圖返回子單元,用于返回所述第一目標多媒體文件中對應時間值處的視頻截圖。可選地,還包括關鍵詞擴展單元,用于當接收查詢關鍵詞時,通過查詢預置的語義相關詞語數據庫,獲取與所述關鍵詞語義相關的相關關鍵詞;第二搜索單元,用于獲取包含有所述相關關鍵詞的第二目標文本輔助信息文件,并確定出所述相關關鍵詞在所述第二目標文本輔助信息文件中所在位置處的時間值;第二信息返回單元,用于根據所述第二目標文本輔助信息文件確定對應的第二目標多媒體文件,并返回所述第二目標多媒體文件中對應時間值處的相關信息。可選地,所述文本輔助信息文件獲取單元具體用于從預置的文本輔助信息文件資源庫中,為各個多媒體文件選擇匹配的文本輔助信息文件。根據本專利技術提供的具體實施例,本專利技術公開了以下技術效果通過本專利技術,可以通過將多媒體文件與其文本輔助信息文件進行綁定,從而可以通過搜索關鍵詞在文本輔助信息文件中的時間點,準確找到其在多媒體文件中的時間點,進而就可以將多媒體文件中對應時間點上的相關信息返回給用戶,從而可以實現對多媒體文件的全文搜索,使得用戶可以準確地找到某片段,或者某個畫面、某句臺詞等等,極大地 方便了用戶的應用。附圖說明為了更清楚地說明本專利技術實施例或現有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖I是本專利技術實施例提供的方法的流程圖;圖2是本專利技術實施例提供的方法中一界面示意圖;圖3是本專利技術實施例提供的方法中另一界面示意圖;圖4是本專利技術實施例提供的裝置的示意圖。具體實施例方式下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員所獲得的所有其他實施例,都屬于本專利技術保護的范圍。參見圖1,本專利技術實施例提供的多媒體文件搜索方法可以包括以下步驟SlOl :獲取多媒體文件的文本輔助信息文件,所述文本輔助信息文件中保存有多媒體文件的文本內容以及對應的時間點信息;在本專利技術實施例中,多媒體文件可以包括視頻文件(即既有聲音又有圖像的文件,例如RMVB等格式的電影、電視劇文件等)、音頻文件(即只有聲音沒有圖像的文件,例如MP3等格式的歌曲文件等),其中,關于視頻文件,文本輔助信息文件可以是指SRT等格式的字幕文件,這些字幕文件作為視頻資源的精確補充,通常包含了臺詞出現的特定時間和臺詞的中英文文本信息,還可能包括場景解釋、人物解釋等;關于音頻文件,文本輔助信息文件可以是指LRC等格式的歌詞文件等等。這些文件一般都是由專業人員制作的,具有較高的準確性,因此,在本專利技術實施例中,可以以這些文本輔助信息文件為基礎對多媒體文件進行搜索。具體實現時,一般會存在一些專門提供文本輔助信息文件的數據庫、網站等,因此,為了給多媒體文件匹配文本輔助信息文件本文檔來自技高網...
【技術保護點】
一種多媒體文件搜索方法,包括:獲取多媒體文件的文本輔助信息文件,所述文本輔助信息文件中保存有多媒體文件的文本內容以及對應的時間點信息;基于所述文本輔助信息文件中的文本內容為所述多媒體文件建立索引;當接收到搜索關鍵詞時,獲取包含有所述搜索關鍵詞的第一目標文本輔助信息文件,并確定出所述搜索關鍵詞在所述第一目標文本輔助信息文件中所在位置處的時間值;根據所述第一目標文本輔助信息文件確定對應的第一目標多媒體文件,并返回所述第一目標多媒體文件中對應時間值處的相關信息。
【技術特征摘要】
【專利技術屬性】
技術研發人員:郭帥,吳海生,
申請(專利權)人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。