【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及一種檢測(cè)語(yǔ)音識(shí)別功能的變化,對(duì)識(shí)別的語(yǔ)音信號(hào)進(jìn)行加工處理以適合語(yǔ)音識(shí)別功能的變化的技術(shù)。
技術(shù)介紹
以往以來,在車載信息設(shè)備或移動(dòng)電話機(jī)等的終端裝置中,人們?yōu)榱送ㄟ^用戶的講話語(yǔ)音進(jìn)行其操作,一直在開發(fā)裝入了語(yǔ)音識(shí)別功能的設(shè)備。近年來,由于數(shù)據(jù)通信技術(shù)的發(fā)展,因而將輸入到終端裝置中的講話語(yǔ)音經(jīng)由網(wǎng)絡(luò)發(fā)送給語(yǔ)音識(shí)別服務(wù)器來作為語(yǔ)音數(shù)據(jù),利用語(yǔ)音識(shí)別服務(wù)器豐富的計(jì)算資源,進(jìn)行更高精度的語(yǔ)音識(shí)別的方式正在普及。語(yǔ) 音識(shí)別因用戶不清晰的講話或背景噪音等的影響,而總是伴隨誤識(shí)別的風(fēng)險(xiǎn)。在未發(fā)覺到誤識(shí)別的狀況下繼續(xù)設(shè)備的操作因?yàn)閷⑤^大地破壞用戶的便利性,所以例如下述專利文獻(xiàn)I那樣,公示出一種根據(jù)講話語(yǔ)音中含有的噪聲量及其噪聲發(fā)生原因的信息,只將判斷為能夠語(yǔ)音識(shí)別的講話語(yǔ)音當(dāng)作語(yǔ)音識(shí)別對(duì)象的技術(shù)。專利文獻(xiàn)I日本特開2005-91611號(hào)公報(bào)(例如參見段落0012)
技術(shù)實(shí)現(xiàn)思路
如上所述,近年來語(yǔ)音識(shí)別服務(wù)器作為廣泛應(yīng)用的服務(wù)來運(yùn)營(yíng)的例子正在增加,提供面向用戶使用的終端裝置的服務(wù)的主體和運(yùn)營(yíng)語(yǔ)音識(shí)別服務(wù)器的主體不同的情形在增多。因此,不知不覺間,沒有發(fā)現(xiàn)語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別功能已變更的情形發(fā)生。另夕卜,因?yàn)榧幢阍诜?wù)的提供主體和運(yùn)營(yíng)主體相同的情況下,語(yǔ)音識(shí)別服務(wù)器的內(nèi)部狀態(tài)(例如處理負(fù)荷的大小)也時(shí)時(shí)刻刻發(fā)生變化,所以仍有時(shí)難以完全持續(xù)掌握語(yǔ)音識(shí)別性能的變化。在那種情況下,繼續(xù)提供對(duì)用戶的語(yǔ)音識(shí)別功能的服務(wù)時(shí),例如假設(shè)語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別性能因某種原因下降,則無法探測(cè)其語(yǔ)音識(shí)別性能的下降,在結(jié)果上存在給用戶提供低品質(zhì)的語(yǔ)音識(shí)別服務(wù)的可能性。另外,在為了 ...
【技術(shù)保護(hù)點(diǎn)】
一種語(yǔ)音數(shù)據(jù)中繼裝置,連接終端裝置和語(yǔ)音識(shí)別服務(wù)器,該終端裝置錄制用戶講話中的聲音,發(fā)送講話語(yǔ)音來作為語(yǔ)音數(shù)據(jù),并且接收所發(fā)送的該語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果,輸出給上述用戶,該語(yǔ)音識(shí)別服務(wù)器接收來自上述終端裝置的語(yǔ)音數(shù)據(jù),識(shí)別該語(yǔ)音數(shù)據(jù),發(fā)送其識(shí)別結(jié)果,該語(yǔ)音數(shù)據(jù)中繼裝置的特征為,具備:存儲(chǔ)部,存儲(chǔ)對(duì)上述語(yǔ)音數(shù)據(jù)進(jìn)行加工處理時(shí)使用的第1參數(shù)的值和為了評(píng)價(jià)上述語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別性能而使用的評(píng)價(jià)用語(yǔ)音數(shù)據(jù);數(shù)據(jù)處理部,針對(duì)上述評(píng)價(jià)用語(yǔ)音數(shù)據(jù),使用上述第1參數(shù)的值進(jìn)行加工處理來生成第1語(yǔ)音數(shù)據(jù),針對(duì)從上述終端裝置接收到的語(yǔ)音數(shù)據(jù),使用上述第1參數(shù)的值進(jìn)行加工處理來生成第2語(yǔ)音數(shù)據(jù);服務(wù)器通信部,將上述第1語(yǔ)音數(shù)據(jù)發(fā)送給上述語(yǔ)音識(shí)別服務(wù)器,從上述語(yǔ)音識(shí)別服務(wù)器接收第1識(shí)別結(jié)果,將上述第2語(yǔ)音數(shù)據(jù)發(fā)送給上述語(yǔ)音識(shí)別服務(wù)器,從上述語(yǔ)音識(shí)別服務(wù)器接收第2識(shí)別結(jié)果;終端通信部,將對(duì)上述第2語(yǔ)音數(shù)據(jù)的上述第2識(shí)別結(jié)果發(fā)送給上述終端裝置;以及參數(shù)變更部,根據(jù)接收到的對(duì)上述第1語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果,更新存儲(chǔ)在上述存儲(chǔ)部中的上述第1參數(shù)的值。
【技術(shù)特征摘要】
2011.06.22 JP 138318/20111.一種語(yǔ)音數(shù)據(jù)中繼裝置,連接終端裝置和語(yǔ)音識(shí)別服務(wù)器,該終端裝置錄制用戶講話中的聲音,發(fā)送講話語(yǔ)音來作為語(yǔ)音數(shù)據(jù),并且接收所發(fā)送的該語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果,輸出給上述用戶,該語(yǔ)音識(shí)別服務(wù)器接收來自上述終端裝置的語(yǔ)音數(shù)據(jù),識(shí)別該語(yǔ)音數(shù)據(jù),發(fā)送其識(shí)別結(jié)果,該語(yǔ)音數(shù)據(jù)中繼裝置的特征為, 具備 存儲(chǔ)部,存儲(chǔ)對(duì)上述語(yǔ)音數(shù)據(jù)進(jìn)行加工處理時(shí)使用的第I參數(shù)的值和為了評(píng)價(jià)上述語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別性能而使用的評(píng)價(jià)用語(yǔ)音數(shù)據(jù); 數(shù)據(jù)處理部,針對(duì)上述評(píng)價(jià)用語(yǔ)音數(shù)據(jù),使用上述第I參數(shù)的值進(jìn)行加工處理來生成第I語(yǔ)音數(shù)據(jù),針對(duì)從上述終端裝置接收到的語(yǔ)音數(shù)據(jù),使用上述第I參數(shù)的值進(jìn)行加工處理來生成第2語(yǔ)音數(shù)據(jù); 服務(wù)器通信部,將上述第I語(yǔ)音數(shù)據(jù)發(fā)送給上述語(yǔ)音識(shí)別服務(wù)器,從上述語(yǔ)音識(shí)別服務(wù)器接收第I識(shí)別結(jié)果,將上述第2語(yǔ)音數(shù)據(jù)發(fā)送給上述語(yǔ)音識(shí)別服務(wù)器,從上述語(yǔ)音識(shí)別服務(wù)器接收第2識(shí)別結(jié)果; 終端通信部,將對(duì)上述第2語(yǔ)音數(shù)據(jù)的上述第2識(shí)別結(jié)果發(fā)送給上述終端裝置;以及參數(shù)變更部,根據(jù)接收到的對(duì)上述第I語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果,更新存儲(chǔ)在上述存儲(chǔ)部中的上述第I參數(shù)的值。2.如權(quán)利要求I所述的語(yǔ)音數(shù)據(jù)中繼裝置,其特征為, 上述存儲(chǔ)部還存儲(chǔ)履歷信息,該履歷信息是將過去發(fā)送給上述語(yǔ)音識(shí)別服務(wù)器的上述第I語(yǔ)音數(shù)據(jù)及上述識(shí)別結(jié)果建立關(guān)聯(lián)后的信息, 上述參數(shù)變更部參照上述履歷信息,與上述服務(wù)器通信部接收到的對(duì)上述第I語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果進(jìn)行比較,在上述接收到的識(shí)別結(jié)果和上述過去的識(shí)別結(jié)果不同的情況下,更新上述參數(shù)的值。3.如權(quán)利要求2所述的語(yǔ)音數(shù)據(jù)中繼裝置,其特征為, 具備處理部,執(zhí)行附加處理、或者卷積處理和上述附加處理的雙方,來生成上述評(píng)價(jià)用語(yǔ)音數(shù)據(jù),該附加處理針對(duì)在沒有噪音的狀態(tài)下所錄制的講話內(nèi)容為預(yù)先已知的語(yǔ)音數(shù)據(jù),附加錄制了噪音的噪音數(shù)據(jù),該卷積處理按上述終端裝置和上述用戶的口部之間的傳導(dǎo)特性進(jìn)行過濾。4.如權(quán)利要求3所述的語(yǔ)音數(shù)據(jù)中繼裝置,其特征為, 上述處理部在上述附加處理中,取得由上述終端裝置所錄制的上述講話中的聲音之內(nèi)、沒有語(yǔ)音的區(qū)間的聲音,來作為上述噪音數(shù)據(jù),調(diào)整上述噪音數(shù)據(jù)的增益,并生成信噪比不同的上述評(píng)價(jià)用語(yǔ)音數(shù)據(jù)。5.如權(quán)利要求4所述的語(yǔ)音數(shù)據(jù)中繼裝置,其特征為, 上述處理部在上述附加處理中,取得由上述終端裝置所錄制的上述講話中的聲音之內(nèi)、語(yǔ)音區(qū)間的聲音,根據(jù)該聲音的功率,來調(diào)整上述評(píng)價(jià)用語(yǔ)音數(shù)據(jù)的語(yǔ)音數(shù)據(jù)的增益。6.如權(quán)利要求I所述的語(yǔ)音數(shù)據(jù)中繼裝置,其特征為, 與多個(gè)上述語(yǔ)音識(shí)別服務(wù)器連接, 上述存儲(chǔ)部還存儲(chǔ)進(jìn)行下述處理時(shí)使用的第2參數(shù)的值,該處理將從上述多個(gè)語(yǔ)音識(shí)別服務(wù)器接收到的多個(gè)識(shí)別結(jié)果綜合為I個(gè)識(shí)別結(jié)果, 上述語(yǔ)音數(shù)據(jù)中繼裝置具備識(shí)別結(jié)果綜合部,該識(shí)別結(jié)果綜合部將從上述多個(gè)語(yǔ)音識(shí)別服務(wù)器接收到的多個(gè)識(shí)別結(jié)果,使用上述第2參數(shù)的值來生成I個(gè)識(shí)別結(jié)果, 上述終端通信部將上述識(shí)別結(jié)果綜合部所生...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:大淵康成,本間健,
申請(qǐng)(專利權(quán))人:歌樂株式會(huì)社,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。