• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    用于提供語音識別的方法和系統(tǒng)技術(shù)方案

    技術(shù)編號:5479969 閱讀:208 留言:0更新日期:2012-04-11 18:40
    公開了一種用于提供語音識別的方法?;谟捎脩羲峁┑臄?shù)據(jù)來從用戶獲取名字。向用戶詢問用戶的名字。接收來自用戶的響應(yīng)于該詢問的第一音頻輸入。使用名字語法數(shù)據(jù)庫將語音識別應(yīng)用于第一音頻輸入,以輸出被識別的名字。確定該被識別的名字是否與所獲取的名字匹配。如果確定沒有匹配,則向用戶重新詢問用戶的名字,以用于第二音頻輸入。使用具有少于名字語法數(shù)據(jù)庫的條目的信任度數(shù)據(jù)庫將語音識別應(yīng)用于第二音頻輸入。

    【技術(shù)實現(xiàn)步驟摘要】
    【國外來華專利技術(shù)】用于提供語音識別的方法和系統(tǒng)相關(guān)申請本申請要求2006年9月25日所提交的美國專利申請序號11/526,395 (代理人案號COS06005)的優(yōu)先權(quán),其內(nèi)容通過引用并入本文中。
    技術(shù)介紹
    對于收集和向用戶提供信息二者而言,語音識別在通信系統(tǒng)中起 重要的作用。傳統(tǒng)地,交互式話音應(yīng)答(IVR)系統(tǒng)已經(jīng)依賴于雙音多 頻(DTMF)和語音輸入的組合來獲得并且處理信息。然而,對于需要 輸入大量數(shù)字、字母和字的復(fù)雜事務(wù)而言,IVR系統(tǒng)的思想比其概念更 加吸引人。即,對于復(fù)雜的數(shù)據(jù)條目而言,典型的DTMF接口已證明是 無法行得通的緩慢。比如,組織變得總是依賴于基于話音的系統(tǒng)來擴 大DTMF輸入。不幸的是,基于話音的系統(tǒng)己經(jīng)引入了與口語和人類話 語的無窮變化的錯綜復(fù)雜相關(guān)的新的、更具有挑戰(zhàn)性的問題。因此, 在將口語話語轉(zhuǎn)換為對應(yīng)的文本字符串或其它等價符號表示的方面 上,實現(xiàn)語音識別技術(shù)的IVR系統(tǒng)已經(jīng)證明是不可接受的不準(zhǔn)確。因此,存在用于提供語音識別的改進(jìn)的方法的需要。附圖說明通過示例的方法而不是限制的方法在附圖的圖中圖示本專利技術(shù),并 且其中相同的附圖標(biāo)記指的是類似的元件,并且在附圖中圖l是圖示根據(jù)本專利技術(shù)實施例的能夠提供語音識別來獲得名字的 通信系統(tǒng)的示圖2是根據(jù)本專利技術(shù)實施例的示例性交互式話音應(yīng)答(IVR)單元的示圖3是根據(jù)本專利技術(shù)實施例的語音識別系統(tǒng)的示圖;圖4A和圖4B是根據(jù)本專利技術(shù)實施例的語音識別過程的流程圖; 圖5是能夠被用于實現(xiàn)本專利技術(shù)各種實施例的計算機系統(tǒng)的示圖。具體實施例方式描述了一種用于提供語音識別的裝置、方法和軟件。在下面的描 述中,為了解釋的目的,闡明了許多特定細(xì)節(jié),以便于提供本專利技術(shù)的 詳盡理解。然而,對于一個本領(lǐng)域中普通技術(shù)人員來說,顯然不使用 這些特定細(xì)節(jié)或使用等價布置也可以實踐本專利技術(shù)。在其它實例中,為 了避免不必要地混淆本專利技術(shù),以框圖的形式示出熟知的結(jié)構(gòu)和設(shè)備。雖然針于代名詞(例如,名字)的語音識別來描述本專利技術(shù)的各種 實施例,但是認(rèn)為這些實施例對使用等價接口和操作的廣義語音識別 具有適用性。圖1是圖示根據(jù)本專利技術(shù)實施例的能夠提供語音識別來獲得名字的通信系統(tǒng)的示圖。通信系統(tǒng)100包括利用名字語法數(shù)據(jù)庫103、信任度 數(shù)據(jù)庫105的語音識別系統(tǒng)(或邏輯)101。語音識別系統(tǒng)101利用交 互式話音應(yīng)答(IVR)單元(或系統(tǒng))107來操作,其通過電話網(wǎng)絡(luò)111 從站109接收話音呼叫。電話網(wǎng)絡(luò)111能夠是電路切換系統(tǒng)或分組話 音網(wǎng)絡(luò)(例如,網(wǎng)際協(xié)議話音(VoIP)網(wǎng)絡(luò))。分組話音網(wǎng)絡(luò)111能 夠由支持麥克風(fēng)和揚聲器功能的適當(dāng)?shù)恼?09—一例如,計算機、工作 站或其它設(shè)備(例如,個人數(shù)字助理(PDA)等)來訪問。除了其它 功能,IVR系統(tǒng)107采集并且向用戶提供數(shù)據(jù)。圖2中更加充分地解 釋了IVR系統(tǒng)107。由數(shù)據(jù)存儲庫113支持?jǐn)?shù)據(jù)采集。為了說明的目的,針于表示名字的音頻信號的識別來描述語音識 別系統(tǒng)101。用戶的名字可論證地是最日常收集的、普遍使用的信息片 段。不幸的是,獲得用戶的名字對于利用雙音多頻(DTMF)輸入接口 的常規(guī)系統(tǒng)來說是一項困難的任務(wù)。例如,隨著包含在個人的名字中 的字母數(shù)量的增加,DTMF接口變得日益地不實用。而且,很多電話設(shè)計(特別是蜂窩電話)需要將揚聲器和撥號鍵盤組建在一起,使得 用戶可以方便地使用撥號鍵盤并且接聽話音詢問。因此,語音識別已 經(jīng)被引入以補充DTMF接口。傳統(tǒng)的語音識別接口高度地取決于語法內(nèi)容和普通的發(fā)音規(guī)則來 實現(xiàn)準(zhǔn)確的轉(zhuǎn)換結(jié)果。然而,對于用戶名字(或任意固有名詞),因 為這些類型的字通常不具有能夠被用以在可能的轉(zhuǎn)換選擇中進(jìn)行區(qū)分 的顯著的語法內(nèi)容,所以這些技術(shù)證明是不充分的。另外,由于固有 名詞包含不成比例的大量非標(biāo)準(zhǔn)發(fā)音變化,所以即使有的話,普通的 發(fā)音規(guī)則也提供極小的有利價值。因此,不僅通過內(nèi)容的損失也通過 音素本身之間的聽覺差別來例示語音的變化性。另外,獨立于被轉(zhuǎn)換的言語類型的一組特有的復(fù)雜性妨礙了語音 識別技術(shù)。例如,由環(huán)境背景噪聲、麥克風(fēng)位置以及轉(zhuǎn)換器質(zhì)量所引 入的聲音的變化性增加了轉(zhuǎn)換準(zhǔn)確度的損失。此外,從物理和情感狀 態(tài)、語速、話音質(zhì)量和強度、社會語言背景、方言以及聲道大小和形 狀引起的揚聲器的變化性也造成識別準(zhǔn)確度的損失。返回圖1,以下針于圖3更充分地描述的語音識別系統(tǒng)101能夠支持包括與人類用戶的交互的各種應(yīng)用,諸如,呼叫流程處理、目錄 輔助、商務(wù)事務(wù)(例如,航空票務(wù)、股票代理、銀行業(yè)務(wù)、訂購等)、 瀏覽/采集信息等。雖然沒有示出,但是IVR系統(tǒng)107能夠經(jīng)由數(shù)據(jù)網(wǎng)絡(luò)來訪問數(shù)據(jù) 存儲庫113,該數(shù)據(jù)網(wǎng)絡(luò)能夠包括本地區(qū)域網(wǎng)絡(luò)(LAN)、廣域網(wǎng)絡(luò) (WAN)、蜂窩或衛(wèi)星網(wǎng)絡(luò)、因特網(wǎng)等。另外,那些本領(lǐng)域中普通技 術(shù)人員將意識到的是,數(shù)據(jù)存儲庫113能夠被直接鏈接到或被包括在 IVR系統(tǒng)107內(nèi)。比如,數(shù)據(jù)存儲庫113能夠是將個性化信息與用戶 名字相關(guān)聯(lián)的任意類型的信息存儲(例如,數(shù)據(jù)庫、服務(wù)器、計算機 等)。該個性化信息能夠包括出生日期、賬號(例如,銀行、簽帳卡、計費代碼等)、社會安全號碼(SSN)、地址(例如,工作、家庭、網(wǎng)際協(xié)議(IP)、介質(zhì)訪問控制(MAC)等)、電話列表(家庭、工作、 蜂窩電話等)、以及例如生物識別碼、聲印(voice print)等任意其它 形式的唯一可識別數(shù)據(jù)的任意一個或其組合。在本專利技術(shù)的一個實施例中,將數(shù)據(jù)存儲庫113配置為允許使用一 個或多個以上所列出的個性化信息形式來反向檢索用戶的名字。此外, 能夠由任意資源,包括第三方供應(yīng)商,來自動更新并且維持?jǐn)?shù)據(jù)存儲 庫113。雖然將語音識別系統(tǒng)101示作獨立的組件,但是可以認(rèn)為,語音 識別系統(tǒng)101能夠與IVR系統(tǒng)107集成。圖2是根據(jù)本專利技術(shù)實施例的示例性交互式話音應(yīng)答(IVR)系統(tǒng)的 示圖。在該示例中,IVR系統(tǒng)107包括電話接口 201、資源管理器203、 以及話音瀏覽器205。 IVR系統(tǒng)107利用電話接口 201用于通過電話網(wǎng) 絡(luò)111與一個或多個用戶進(jìn)行通信。在可選實施例中,根據(jù)用戶的訪 問方法來利用其它接口。此外,雖然將IVR系統(tǒng)示作獨立的、分布的 實體,但是IVR系統(tǒng)107能夠?qū)⒁恍┗蛩械墓δ懿⑷雴我坏木W(wǎng)絡(luò)元 件。如圖所示,資源管理器203提供各種語音資源,諸如驗證系統(tǒng)207、 自動語音識別器(ASR) 209、和文本到語音(TTS)引擎211。 TTS 引擎211將來自話音瀏覽器205的文本信息(數(shù)字信號)轉(zhuǎn)換為語音 (模擬信號),用于向用戶進(jìn)行回放。TTS引擎211通過前端輸入和 后端輸出來完成該轉(zhuǎn)變。該輸入通過文本標(biāo)準(zhǔn)化、預(yù)處理和/或斷詞將 純文本轉(zhuǎn)換為其等價的寫出字。隨后,字被指派標(biāo)音,并且被劃分為 韻律單位,例如,短語、分句和/或句子。使用該標(biāo)音和韻律安排的組合,前端輸入向后端輸出傳送符號語言表示,以用于合成。基于期望 的自然性或可理解性的級別,后端輸出能夠通過下面合成過程的任意9一個來生成語音波形連續(xù)式、單位選擇、雙音、域指定、共振峰、音韻(articulatory)、隱藏式馬可夫模型(HMM)以及其它類似方法, 以及其任意的混合組合。通過合成過程,后端輸出生成向用戶傳送的 實際聲音輸出。ASR 209能夠有效地作為語音識別系統(tǒng)101,或者本文檔來自技高網(wǎng)...

    【技術(shù)保護點】
    一種方法,包括: 基于由用戶提供的數(shù)據(jù)來從所述用戶獲取名字; 向所述用戶詢問所述用戶的名字; 接收來自所述用戶的響應(yīng)于所述詢問的第一音頻輸入; 使用名字語法數(shù)據(jù)庫將語音識別應(yīng)用于所述第一音頻輸入,以輸出被識別的名字;  確定所述被識別的名字是否與所述被獲取的名字匹配; 如果確定沒有匹配,則向所述用戶重新詢問所述用戶的名字; 接收來自所述用戶的響應(yīng)于所述重新詢問的第二音頻輸入;以及 使用具有少于所述名字語法數(shù)據(jù)庫的條目的信任度數(shù)據(jù)庫 將語音識別應(yīng)用于所述第二語音輸入。

    【技術(shù)特征摘要】
    【國外來華專利技術(shù)】...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:戴維桑內(nèi)魯?shù)?/a>,
    申請(專利權(quán))人:
    維里遜商務(wù)網(wǎng)絡(luò)服務(wù)有限公司
    類型:發(fā)明
    國別省市:US[美國]

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲国产av高清无码| 无码精品不卡一区二区三区| 夜夜添无码试看一区二区三区| 无码色AV一二区在线播放| AV无码小缝喷白浆在线观看 | 在线看无码的免费网站| 无码人妻精品一区二区三区蜜桃| 国产精品成人无码免费| 久久精品aⅴ无码中文字字幕| 亚洲AV无码一区二区三区电影| 精品无码一级毛片免费视频观看| 精品三级AV无码一区| 97无码人妻福利免费公开在线视频| 亚洲中文久久精品无码1| 丝袜无码一区二区三区| 国产AV无码专区亚洲AV蜜芽| 秋霞无码一区二区| 免费无码又爽又刺激一高潮| 国产精品无码无卡在线观看久| 人妻无码久久一区二区三区免费 | 99热门精品一区二区三区无码| 亚洲AV无码一区二三区| 亚洲午夜无码久久久久软件 | 国产午夜无码视频免费网站| 亚洲av无码一区二区乱子伦as| 精品久久久久久无码国产| 亚洲a无码综合a国产av中文 | 中文字幕av无码一二三区电影| 丰满日韩放荡少妇无码视频 | 曰产无码久久久久久精品| 亚洲成AV人在线播放无码| 精品无码三级在线观看视频| 国产成人无码精品久久久免费| 国产免费AV片无码永久免费| 无码一区二区三区在线| 婷婷四虎东京热无码群交双飞视频| 久久久久久国产精品免费无码| 亚洲国产一二三精品无码| 亚洲熟妇无码乱子AV电影| 国产精品三级在线观看无码| 亚洲AV无码国产精品色午友在线|