一種歌曲處理方法及系統技術方案

技術編號：8271484 閱讀：198 留言：0更新日期：2013-01-31 03:43

本發明專利技術涉及音頻處理領域，提供了一種歌曲處理方法，包括，對海量歌曲文件進行選優，選擇出較好版本的歌曲文件；對海量歌詞選優出歌詞文件，選擇對版完整的歌詞文件；格式化所述選擇出的歌詞文件為時間升序表；分析得出該歌曲快照區域時間；根據快照區域時間對所述歌曲文件進行切割，切割出快照文件。本發明專利技術還提供了一種歌曲處理系統。采用本發明專利技術的技術方案，自動對有歌詞的大量歌曲文件進行分布式系統批量處理，大大提高了處理效率；大大提高了能夠識別高潮區的歌曲量比例，同時在切中關鍵區以及其起止時間的準確度方面也大有改善，在切割的文件體驗上做了很好的改善，切合人的聽覺體驗。

全部詳細技術資料下載

【技術實現步驟摘要】
本專利技術涉及音頻處理領域，特別地涉及一種歌曲處理方法及系統。
技術介紹
隨著移動互聯網的迅猛發展，手機上網越來越多，而通過手機下載歌曲也就越來越多，但用戶面臨的問題是昂貴的流量費和慢的網速，無法滿足用戶需求。為用戶提供歌曲快照片段(高潮部分)，能夠很好的代表這首歌曲，歌曲文件大大減小，對用戶來說能夠很少的花費就可以聽聽這首歌曲好聽不好聽，對版不對版，而且對于現在的很慢的移動網速來說大大節約了用戶時間。同時對移動運營商來說，能減少帶寬并減少服務器壓力，而且能提升用戶體驗。中國專利CN201010531964. O公開了一種音頻切割裝置及方法，其提供的歌曲音·頻切割方法包括獲取歌曲音頻文件的歌詞文本文件；分析該歌詞文本文件中的每句歌詞的重復程度，將該重復程度高于一特定閾值的重復歌詞加入一候選集合；針對該候選集合中的重復歌詞進行分析，獲取其分布位置，連續分布的多句重復歌詞組成段落；根據每句重復歌詞的重復程度以及在段落中的位置，確定一句重復歌詞作為切割起始歌詞，以該切割起始歌詞的開始時間點作為該歌曲音頻文件的切割起始點；利用歌曲切割工具從該切割起始點開始，切割該歌曲音頻文件。采用該方案還存在一些問題，無法精確進行歌詞與歌曲文件的精確匹配，對于歌曲高潮部分的處理準確度較低，并且體驗度無法滿足用戶需求，在處理效率上也有待提聞。因此，需要提供一種歌曲處理方案以更好地滿足用戶需求。
技術實現思路
本專利技術解決的技術問題在于提供了一種歌曲處理方法及系統，以解決現有技術中海量歌曲準確識別快照(歌曲關鍵片段)需要大量人力且低效、成本高問題。為解決上述問題，本專利技術提供了一種歌曲處理...

【技術保護點】
一種歌曲處理方法，其特征在于，包括，對海量歌曲文件進行選優，選擇出較好版本的歌曲文件；對海量歌詞選優出歌詞文件，選擇對版完整的歌詞文件；格式化所述選擇出的歌詞文件為時間升序表；分析得出該歌曲快照區域時間；根據快照區域時間對所述歌曲文件進行切割，切割出快照文件。

【技術特征摘要】
1.一種歌曲處理方法，其特征在于，包括，對海量歌曲文件進行選優，選擇出較好版本的歌曲文件；對海量歌詞選優出歌詞文件，選擇對版完整的歌詞文件；格式化所述選擇出的歌詞文件為時間升序表；分析得出該歌曲快照區域時間；根據快照區域時間對所述歌曲文件進行切割，切割出快照文件。2.根據權利要求I所述的方法，其特征在于，還包括，將所述切割出的快照文件存儲至存儲服務器。3.根據權利要求I或2所述的方法，其特征在于，對海量歌曲文件進行選優，選擇出較好版本的歌曲文件具體包括，將同名，同歌手的歌曲文件為同組，選擇大于特定時長的歌曲文件；同組的歌曲文件中，篩選出相同時長最多的文件為候選文件作為選擇出的較好版本的歌曲文件；如果選出的歌曲文件中有wma格式的，則優選wma格式的歌曲文件作為選擇出的較好版本的歌曲文件；如果有多個歌曲文件，則優選好的來源的歌曲文件作為選擇出的較好版本的歌曲文件。4.根據權利要求3所述的方法，其特征在于，所述對海量歌詞選優出歌詞文件，選擇對版完整的歌詞文件具體包括，將所述歌詞文件統一為相同的歌詞文件格式；對所述歌詞文件進行去除噪音符；根據LRC格式將所述歌詞文件解析成“時間，歌詞”格式，按照時間進行排序列表；將不符合要求的歌詞文件按照特定時長規則進行排除；檢查歌曲文件跟歌詞是否對版，不對版則排除歌詞文件。5.根據權利要求4所述的方法，其特征在于，所述將不符合要求的歌詞文件按照特定時長規則進行排除具體包括，如果最后一句歌詞開始時間小于70秒則排除該歌詞文件；如果最后兩行歌詞時間差大于等于60秒則去掉最后一行；如果歌詞最后一句時間減去篩選的歌曲時長小于-60或大于10，則排除歌詞文件。6.根據權利要求5所述的方法，其特征在于，所述檢查歌曲文件跟歌詞是否對版，不對版則排除歌詞文件具體包括，在歌曲文件時長大于等于歌詞最后一句時間時，(歌曲文件時長X4)小于(歌詞最后一句時間X7)時，以及，在歌曲文件時長小于歌詞最后一句時間時，(歌曲文件時長X5)小于等于(歌詞最后一句時間X3)時，則對版；否則不對版。7.根據權利要求4至6任一所述的方法，其特征在于，所述格式化所述選擇出的歌詞文件為時間升序表具體包括，轉換歌詞為統一格式；替換所有\r、\n\n、\n為\n，替換所有\t、多空格為單空格；對所述歌詞文件去噪，將噪符去除；解析歌詞為時間...

【專利技術屬性】
技術研發人員：張云飛，劉軍，陳偉，李錦根，黃興紅，
申請(專利權)人：北京宜搜天下科技有限公司，
類型：發明
國別省市：