• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種通過語音喚醒尋找手機的方法及系統技術方案

    技術編號:8685791 閱讀:543 留言:0更新日期:2013-05-09 05:19
    本發明專利技術公開了一種通過語音喚醒技術來尋找手機的方法及系統。所述系統應用于智能手機上,包括:一語音端點檢測(VAD)模塊,負責實時檢測手機麥克風數據,檢測是否有用戶在說話及其說話的開始時間點;一語音喚醒模塊,負責對語音端點檢測模塊檢測到的語音進行實時解碼,檢測用戶是否說了喚醒詞;一自定義喚醒詞模塊,負責根據用戶需求,自定義喚醒詞并生成相應的資源。本發明專利技術通過智能語音喚醒技術檢測到用戶在尋找手機,并在檢測到喚醒詞后啟動手機鈴聲和/或震動,從而能夠方便、快捷地找到手機。本發明專利技術還提供了用戶自定義喚醒詞的功能,根據用戶自身喜好定制個性化的喚醒詞,讓尋找手機更有樂趣。

    【技術實現步驟摘要】

    本專利技術涉及遠距離語音識別領域,由其涉及一種語音喚醒識別手機的方法及系統。
    技術介紹
    在日常使用手機的過程中,經常會發生到處找手機找不到的情況。一般情況下,會通過另外一部電話撥打該手機的電話號碼的方式來找手機。這種方式尋找手機需要滿足一定的前提條件,存在一定的局限性。比如:沒有第二部手機發起主動呼叫時,或者用戶不記得自己的手機號的情況下,則無法通過上述方式找到手機。已公開的專利文獻,如公開號為CN102136855A和CN101132196A的專利,都涉及到了采用近距離無線通信技術來尋找手機的方法。但這類方法需要額外增加一個與手機獨立的硬件設備,而且需要在手機硬件內部增加相應的通訊硬件設備。這種體系結構有一定的局限性:一是必須在手機的硬件設計時考慮增加該功能,實現起來技術復雜、開發測試周期較長;二是增加了手機設計和生產的成本;三是額外的增加了第二個外部設備,用戶需要隨身攜帶,使用起來非常不方便。因此,很少在實際的手機中見到有基于這類專利的應用。
    技術實現思路
    本專利技術的目的在于提供一種通過語音喚醒技術實現的更高效自然、方便快捷的尋找手機的方法及系統。本專利技術提供一種通過語音喚醒技術尋找手機的方法,包括:建立一個覆蓋全國各方言區口音的語音庫和各種實際環境下的噪聲數據庫。采用中的語音庫訓練音素模型,并通過狀態聚類方法得到上下文相關的三元音素模型;采用語音庫及噪聲數據庫訓練VAD模型。根據使用者提供的喚醒詞文本,通過自適應方法從音素模型中生成定制音素模型。根據使用者提供的喚醒詞文本,通過語音識別解碼網絡擴展方法,生成定制的喚醒詞檢測所需要的解碼網絡資源。根據使用者的實際需求,本專利技術通過在語音識別網絡標識多個喚醒詞對應文本的方法,以支持使用者定義多個喚醒詞,這樣使用者將自己常用且熟悉的詞定義成喚醒詞,通過說不同的喚醒詞都可以尋找到手機,避免使用者忘記單個喚醒詞帶來的不便。采用VAD模型,對手機麥克風采集的語音逐幀計算語音和噪聲的似然比,并根據似然比判斷是否是語音,如果是靜音或者環境噪聲則舍棄,如果是語音則將語音數據進行實時檢測,采用音素模型及解碼網絡資源進行實時解碼,檢測語音中是否出現喚醒詞。檢測出喚醒詞后,調用智能手機的相應接口,讓手機播放鈴聲和/或震動,以便使用者可以方便的知道手機所在的位置。當使用者找到手機后,手動停止播放鈴聲和/或震動。本專利技術提供兩種喚醒模式,喚醒模式一允許使用者在任意時間說出喚醒詞來尋找手機,在該模式工作狀態下,只要使用者說出喚醒詞即可以實現手機喚醒;喚醒模式二要求喚醒詞在句首才能夠有效進行尋找手機,在該模式工作狀態下,可以避免在隨意聊天時無意中說到了喚醒詞導致的誤喚醒操作。使用者可以動態地設置和切換兩種喚醒模式,十分方便。遠距離喚醒是本專利技術的一個重要技術特征,和傳統的語音處理技術相比,由于使用者說話時離手機設備的麥克風的距離一般在0.2米 10米范圍內,而傳統語音處理技術,這個距離一般在0.2米以內,因此,在進行語音處理時,遠距離語音中不僅受到周圍環境噪聲的影響,更重要的是語音信號的混響會導致語音喚醒的正確率大幅度下降。針對遠距離語音信號的這一特點,本專利技術采用了針對性的算法研究,以大幅提升遠距離情況下語音喚醒的成功率。具體算法主要包括遠距離語音信號處理和遠距離語音聲學模型訓練兩部分,詳細描述如下:遠距離語音信號處理算法包括兩部分:首先進行前端處理,傳統語音信號處理中的采用的短時譜分析無法解決混響帶來的問題,本算法通過長時譜分析算法、譜減法去除混響信號帶來的譜激變;然后,在提取出聲學特征后,采用減均值、方差規整并進行自回歸滑動平均模型算法去除由于環境噪聲帶來的譜激變。遠距離語音聲學模型訓練流程,首先在訓練數據中針對性的增加遠距離錄音數據,使得訓練出來的聲學模型能夠與實際使用環境相匹配。同時,針對遠距離進行了 HMM狀態數、音素模型聚類算法調整,進一步提升遠距離語音下的性能。本專利技術提供一種通過語音喚醒技術尋找手機的方法和系統,所述系統包括:語音喚醒模塊,用于實時檢測語音數據中的喚醒詞并控制手機播放鈴聲和/或震動提示用戶手機具體方位;自定義喚醒詞模塊,用于輸入喚醒詞文本,并向云端自定義喚醒詞模塊發送請求,完成喚醒詞資源包的下載。云端自定義喚醒詞模塊,用于接收自定義喚醒詞模塊發送的請求并進行處理,提供喚醒詞資源包的下載。本專利技術的優點:一是不需要增加額外的硬件,直接將系統安裝到手機上便可以使用;二是使用者直接通過說話來尋找手機,提供了一種非常自然、快捷的尋找手機的方法;三是使用者可以自定義個性化的說法來尋找手機,讓找手機的過程充滿樂趣。附圖說明圖1是本專利技術實施例尋找手機的系統結構2是本專利技術實施例尋找手機的云端自定義喚醒詞的系統結構3是本專利技術實施例尋找手機的方法流程4是本專利技術實施例尋找手機的自定義喚醒詞的方法流程圖具體實施例方式下面結合圖例,給出通過語音喚醒尋找手機的方法及其系統更詳細的技術特征以及一些典型的實施案例。一種通過語音喚醒尋找手機的方法和系統。所述系統由一語音喚醒模塊、自定義喚醒詞模塊和云端自定義喚醒詞系統組成。如圖1所示,所述系統包括語音喚醒模塊11、自定義喚醒詞模塊12、喚醒詞資源包13。在尋找手機時,使用者與手機的距離相對于正常使用語音識別系統而言比較遠的,一般情況下在0.2米到10米的范圍內。在遠距離范圍內,使用者只需要喊出喚醒詞,系統檢測到語音并分析出語音中包含喚醒詞后,即可啟動手機鈴聲和/或震動,從而迅速地找到手機。實際系統存在兩種喚醒模式:模式一只要使用者說出喚醒詞即可以實現手機喚醒;模式二要求喚醒詞在句首才能夠有效進行尋找手機,這主要是考慮避免在隨意聊天時無意中說到了喚醒詞導致的誤喚醒操作,使用者可以動態地設置和切換兩種喚醒模式,十分方便。本實施例所述的語音喚醒模塊11,包括實時錄音模塊IlUVAD模塊112、特征提取模塊113、喚醒詞檢測模塊114和反饋控制模塊115。其中所述實時錄音模塊111通過調用手機通用API接口獲取麥克風數據;VAD模塊112采用基于能量和模型的方法檢測從實時錄音模塊111中獲取的數據中是否存在語音信號,并從數據中將語音信號提取出來;特征提取模塊113負責將語音信號進行長時譜減分析和短時譜特征提取;喚醒詞檢測模塊114通過將語音的聲學特征送入解碼器進行維特比解碼,檢測是否包含有喚醒詞出現;反饋控制模塊115負責檢測到關鍵詞后控制手機向用戶進行反饋,即播放鈴聲和/或使手機震動坐寸ο本實施例的特征提取模塊113中,用于訓練音素單元HMM模型的聲學特征逐幀提取,首先,采用長時譜減法去除遠距離混響帶來的頻譜激變影響,其次,每25ms數據提取出一中貞的預感知線性預測(PLP, Perceptual Linear Prediction)特征,巾貞移為IOms0并采用減均值、方差規整和自回歸滑動平均模型去除環境噪聲影響。在本實施例建立噪聲數據庫,噪聲數據庫要求覆蓋手機實際使用過程中各類實際噪聲環境。錄音設備覆蓋各類常見的智能手機麥克風。在本實施例所述的自定義喚醒詞模塊12,用于輸入喚醒詞文本數據,并向云端自定義喚醒詞模塊的HTTP服務21發送處理請求,在云端自定義喚醒詞模塊完成處理后,進行資源包13的下載及存儲。本模塊支持多個喚醒詞文本輸入。本實本文檔來自技高網...

    【技術保護點】
    一種通過語音喚醒尋找手機的系統,其特征在于,包括:語音喚醒模塊,用于實時檢測語音數據中的喚醒詞并控制手機播放鈴聲和/或震動提示用戶手機具體方位;自定義喚醒詞模塊,用于輸入喚醒詞文本,并向云端自定義喚醒詞模塊發送請求,完成喚醒詞資源包的下載。云端自定義喚醒詞模塊,用于接收自定義喚醒詞模塊發送的請求并進行處理,提供喚醒詞資源包的下載。

    【技術特征摘要】
    1.一種通過語音喚醒尋找手機的系統,其特征在于,包括: 語音喚醒模塊,用于實時檢測語音數據中的喚醒詞并控制手機播放鈴聲和/或震動提示用戶手機具體方位; 自定義喚醒詞模塊,用于輸入喚醒詞文本,并向云端自定義喚醒詞模塊發送請求,完成喚醒詞資源包的下載。云端自定義喚醒詞模塊,用于接收自定義喚醒詞模塊發送的請求并進行處理,提供喚醒詞資源包的下載。2.按權利要求1所述的通過語音喚醒尋找手機的系統,其特征在于: 所述語音喚醒模塊包括, 實時錄音模塊,用于調用手機API接口獲取麥克風數據; VAD模塊,用于檢測從實時錄音模塊中獲取的數據中是否存在語音信號并進行提取; 特征提取模塊,用于將語音信號進行長時譜減分析和短時譜特征提取; 喚醒詞檢測模塊,用于將特征提取模塊提取得到的聲學特征發送給解碼器進行維特比解碼,檢測是否有喚醒詞出現; 反饋控制模塊,用于根據預先設定調用手機響應接口,控制鈴聲和/或手機震動。3.按權利要求1所述的通過語音喚醒尋找手機的系統,其特征在于: 所述自定義喚醒詞模塊,支持一 個喚醒詞和/或多個喚醒詞。4.按權利要求1所述的通過語音喚醒尋找手機的系統,其特征在于: 所述云端自定義喚醒詞模塊包括, 喚醒詞文本接收模塊,用于接收自定義喚醒詞模塊發送的喚醒詞文本請求; 語音庫,用于存儲常用音素和音元字節; 噪聲庫,用于存儲各種實際環境下的噪聲數據; 模型訓練模塊,用于采用基于統計的隱馬爾科夫模型進行音素建模和VAD建模,采用上下文相關的建模方法對狀態數進行聚類,得到上下文相關的三元音素模型及VAD模型;模型裁剪模塊,用于通過分析輸入文本的上下文關系,將模型訓練模塊建立的音素模型進行裁剪; 解碼網絡擴展模塊,用于采用基于加權有限狀態轉換器的方法,結合模型訓練模塊建立的音素模型,將喚醒詞文本轉換為語音識別解碼網絡; 資源包下載模塊,用于提供喚醒詞資源包的下載。5.按權利要求4所述的通過語音喚醒識別手機的系統,其特征在于: 所述解碼網絡擴展模塊既可以部署在云端,也可以部署在本地。6.按權利要求1-5之一所述的通過語音喚醒尋找手機的系統,其特征在于: 通過遠距離語音信號處理和遠距離語音聲學模型訓練提高語音識別正確率, 其中,所述通過遠距離語音信號處理包括:通過長時譜分析算法、譜減法去除混響信號帶來的譜激變,然后,在提取出聲學特征后,采用減均值、方差規整并進行自回歸滑動平均模型算法去除由于環境噪聲帶來的譜激變; 所述遠距離語音聲學模型訓練包括:在訓練數據中針對性的增加遠距離錄音數據,進行HMM狀態數、音素模型聚類算法調整。7.按權利要求1-5之一所述的通過語音喚醒尋找手機的系統,其特征在于:所述智能手機包括兩種...

    【專利技術屬性】
    技術研發人員:雷雄國王艷龍王歡良俞凱鄒平
    申請(專利權)人:蘇州思必馳信息科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久久久久久久免费看无码| 久久伊人亚洲AV无码网站| 亚洲午夜无码久久久久| 无码性午夜视频在线观看| 无码中文av有码中文av| 亚洲综合av永久无码精品一区二区| 精品无码一区二区三区爱欲九九 | 中文字幕人成无码免费视频| 无码精品A∨在线观看无广告| 中文字幕AV中文字无码亚| 无码一区二区三区爆白浆| 日韩免费无码视频一区二区三区| 九九无码人妻一区二区三区| 免费无码一区二区三区| 亚洲精品无码乱码成人| 日韩视频无码日韩视频又2021| 久久午夜伦鲁片免费无码| 亚洲中文久久精品无码ww16| 西西4444www大胆无码| 无码八A片人妻少妇久久| 无码国产伦一区二区三区视频| 东京热加勒比无码少妇| 精品一区二区三区无码视频| 亚州AV综合色区无码一区| 免费人妻无码不卡中文字幕系 | 无码一区二区三区在线| 无码人妻精品一区二区三区99性| 无码少妇一区二区三区浪潮AV| 亚洲精品无码久久不卡| 一本大道无码人妻精品专区| 少妇无码AV无码专区线| 精品国产性色无码AV网站| 日韩精品无码区免费专区| 亚洲Aⅴ在线无码播放毛片一线天| 亚洲国产成人无码av在线播放| 无码国产精品一区二区免费模式| 国产精品无码av在线播放 | 午夜不卡无码中文字幕影院| 亚洲AV无码不卡在线播放| 亚洲AV无码一区二区乱子伦 | 欧洲无码一区二区三区在线观看|