• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    文檔讀出支持設備和方法技術

    技術編號:8532936 閱讀:119 留言:0更新日期:2013-04-04 15:59
    本發明專利技術涉及文檔讀出支持設備和方法。根據一個實施例,提供了一種文檔讀出支持設備,具有第一到第三獲取單元(11、12、14)、提取單元(13、確定單元(16)和用戶驗證單元(17)。第一獲取單元(11)獲取具有文本的文檔。第二獲取單元(12)獲取具有定義的元數據,每個定義包括適用條件和讀出方式。提取單元(13)提取文檔的特征。第三獲取單元(14)獲取執行環境信息。確定單元(16)基于該特征和信息確定讀出的參數候選項。用戶驗證單元(17)展示候選項并接收驗證指令。

    【技術實現步驟摘要】

    在此描述的實施例一般涉及。
    技術介紹
    近年來,隨著計算機資源的發展和硬件的進化,圖書數字化(電子書)受到了很多關注。隨著圖書數字化的發展,用戶可獲得用來瀏覽數字化圖書的終端或軟件程序,且數字化圖書內容的銷售也變得很普遍。而且,很流行數字化圖書創建支持服務。與紙媒相比,數字化圖書仍然有不便之處。但是,通過將需要大量紙張作為媒介的書本轉換為數字數據,可降低用于遞送、存儲和購買的努力和成本。此外,可提供諸如搜索或字典查閱的新使用方法。作為數字書才有的一種使用方法,可獲得這樣的服務,其使用文本語音轉換(TTS)系統而讀出數字書并允許用戶聽取該朗讀聲音。與該服務不同,可常規獲得有聲讀物。但是,有聲讀物要求旁白錄音(narration recording),且在實踐中僅提供有限的書本。相反,根據數字書的讀出服務,使用合成語音可讀出任意文本(與其要旨無關)。因此,用戶可享受聽取不值得旁白錄音的內容(例如,經常更新的內容),或者聽取其有聲讀物沒有被期望以朗讀語音的形式來制作的內容(例如,用戶擁有的任意文檔)。但是,不能獲得這樣的技術,其保證對于與文檔數據的讀出有關的元數據的用戶定制的便利性以及在讀出文檔數據時使用的系統環境的靈活性,并可防止讀出再現性被損害。
    技術實現思路
    本專利技術的目的是提供一種,其保證對于與文檔數據的讀出有關的元數據的用戶定制的便利性以及在讀出文檔數據時使用的系統環境的靈活性,并可防止讀出再現性被損害。根據實施例,一種文檔讀出支持設備具有文檔獲取單元、元數據獲取單元、提取單元、執行環境獲取單元、確定單元和用戶驗證單元。文檔獲取單元被配置為獲取包括多個文本數據的文檔數據。元數據獲取單元被配置為獲取包括多個定義的元數據,每個定義包括與定義將被施加的文本數據有關的條件以及用于與所述條件匹配的文本數據的讀出方式。提取單元被配置為通過將每個定義施加到包括在文檔數據中的文本數據,提取文檔數據的特征。提取環境獲取單元被配置為獲取與其中執行文檔數據的讀出處理的環境有關的執行環境信息。確定單元被配置為,基于文檔數據的特征和執行環境信息,通過將元數據施加到文檔數據,確定執行讀出處理時使用的參數候選項。用戶驗證單元被配置為向用戶展示參數候選項,并接受包括選擇或設定的驗證指令。根據文檔讀出支持設備,可確保對于與文檔數據的讀出有關的元數據的用戶定制的便利性以及在讀出文檔數據時使用的系統環境的靈活性,并可防止讀出再現性被損害。附圖說明圖1是示出根據實施例的示例性文檔讀出支持設備的框圖;圖2是示出設備的示例性處理的流程圖;圖3是示出輸入文檔的實例的表;圖4是示出元數據的實例的表;圖5是示出元數據獲取單元的示例性處理的流程圖;圖6是示出由元數據獲取單元獲取的示例性轉換規則的表;圖7是示出輸入文檔特征提取單元的示例性處理的流程圖;圖8是示出輸入文檔特征提取單元的示例性處理結果的表;圖9是示出輸入文檔特征提取單元的示例性處理結果的表;圖10是示出執行環境獲取單元的示例性執行結果的表;圖11是示出用戶設置限制獲取單元的示例性提取結果的圖;圖12是示出用戶設置限制獲取單元的示例性提取結果的表;圖13是示出參數確定單元的示例性處理的流程圖;以及圖14是示出用戶驗證單元的示例性展示的表。具體實施例方式以下將參考附圖詳細描述根據本專利技術實施例的文檔讀出支持設備。注意在以下的實施例中,由相同的參考標號表不的部分執行相同的操作,且其重復描述將被省略。以下將更詳細地描述相關技術。已提出了一些使用合成語音來讀出數字書的技術。例如,作為這些技術中的一個,已知以下技術。在將被分配的書本的內容數據中,提前限定包括在該書中的角色和其對話之間的對應。然后,用戶可自由指定包括在該書中的各個角色與合成語音人物之間的聯系,在聽取(或觀看和聽取)內容時(即,在合成語音朗讀時)合成語音人物讀出角色對話,同時多個合成語音人物的人物影像作為列表被顯示。利用該技術,用戶可為分配的書本中的角色分配他或她喜歡的合成語音人物的人物語音,并可聽取由分配的合成語音讀出的該書本。但是,當這樣的內容分配和用戶定制功能將被實現時,也出現了一些問題。在將被分配的內容數據中,對于每本書,角色和對話須被唯一地并很好地彼此關聯。出于該原因,可被用戶獲得的內容和人物聲音對于用戶來說是從服務供應商獨特分配的,或是由服務供應商所獨特分配的組合。將檢查這樣的框架,其允許用戶根據內容自由地編輯朗讀方式,并根據與服務供應商無關的特定內容而自由地分配并共享與朗讀方式有關的信息。即使在這樣的情況下,在朗讀方式信息中限定的參數和將被使用的語音人物取決于該創建者的環境。出于這個原因,為了允許想要聽取特定內容的用戶參考共享的方式信息來再現該內容的朗讀方式,該用戶必須能使用與方式信息的創建者的環境相同的環境(例如,同一組人物語音、具有同樣或更多功能的話音合成引擎等)。這推動了用戶必須具有任何和所有的語音人物的必要性,這是不現實的。而且,這意味著書數據的讀出處理可僅被內容分配源提供的內容和推薦的環境來實施,且其與用戶的前述自由讀出環境相差甚遠。而且,即使對于同樣的用戶,該用戶用以回放書數據的環境和裝置也通常因情況而變化,且用戶不會總是使用同樣的環境和裝置來聽取書數據。例如,與其中用戶在由諸如臺式PC實現的計算機資源的環境中聽取來自揚聲器的朗讀語音的情況相比,如果他或她通過頭戴式耳機或耳塞、使用諸如蜂窩電話或平板電腦的移動裝置來聽取朗讀語音,例如,一組可獲得的人物語音可被限制或就裝置限制而言,限制了要求大計算量的話音合成引擎功能的使用。相反,已知用戶僅在特定環境下(例如,當用戶在戶外使用移動裝置時,應用減噪功能)想要激活的功能。但是,根據這樣的用戶環境差異和/或可獲得的計算機資源差異,很難通過靈活地應用朗讀方式信息來回放內容。另一方面,以下將檢查這樣的情況,其中元數據的這種共享和創建以民間(grass-roots)方式被傳播給用戶,且可獲得廣泛的變化而不考慮正式或非正式的數據。在這種情況下,用戶可享有的選擇方式增加,而在回放書本前他們不會認識到作為朗讀語音的朗讀方式或人物特征。例如,當惡意用戶準備了在使用該元數據讀取內容時則會引起對應于內容事項的表達不足或突然的極端音量變化的元數據時,或者當例如包括對耳朵不利的讀取語音,就解釋書本或語音人物的個性而言,即使沒有任何危害,根據該元數據的朗讀對于所有用戶來說不總是優點。不能獲得這樣的技術,其保證對于與文檔數據的讀出有關的元數據的用戶定制的便利性以及在讀出文檔數據時使用的系統環境的靈活性,并防止讀出再現性被損害。以下將更詳細地描述實施例。本實施例將考慮這樣的情況,其中在使用合成語音朗讀數字書數據時,作為讀出處理的技巧的例如感情、語氣(tone)、講話者差異等被限定為元數據,且按需要參考這些元數據,以根據輸入文檔的內容或特征的表達多樣性,實現使用合成語音的朗讀。在這種情況下,當信息(元數據)共享并使用對應于內容或專門用于人物語音的朗讀方式(讀出方式)時,考慮到計算機資源的差異或實際可被用戶獲得的功能或將被讀出的內容差異,允許根據本實施例的文檔讀出支持設備嘗試回放而同時保證再現性(或者在適合用戶的情況下再現性可被提高)。以下將示范一種情況作為實際實例,其中用日語讀出日語文檔。但是本文檔來自技高網...

    【技術保護點】
    一種文檔讀出支持設備,其特征在于包括:文檔獲取單元,被配置為獲取包括多個文本數據的文檔數據;元數據獲取單元,被配置為獲取包括多個定義的元數據,每個定義包括與定義將被施加的所述文本數據有關的條件以及用于與所述條件匹配的所述文本數據的讀出方式;提取單元,被配置為通過將每個所述定義施加到包括在所述文檔數據中的所述文本數據,提取所述文檔數據的特征;執行環境獲取單元,被配置為獲取與其中執行所述文檔數據的讀出處理的環境有關的執行環境信息;確定單元,被配置為,基于所述文檔數據的所述特征和所述執行環境信息,通過將所述元數據施加到所述文檔數據,確定在執行所述讀出處理時使用的參數候選項;以及用戶驗證單元,被配置為向用戶展示所述參數候選項,并接受包括選擇或設定的驗證指令。

    【技術特征摘要】
    2011.09.27 JP 211160/20111.一種文檔讀出支持設備,其特征在于包括文檔獲取單元,被配置為獲取包括多個文本數據的文檔數據;元數據獲取單元,被配置為獲取包括多個定義的元數據,每個定義包括與定義將被施加的所述文本數據有關的條件以及用于與所述條件匹配的所述文本數據的讀出方式;提取單元,被配置為通過將每個所述定義施加到包括在所述文檔數據中的所述文本數據,提取所述文檔數據的特征;執行環境獲取單元,被配置為獲取與其中執行所述文檔數據的讀出處理的環境有關的執行環境信息;確定單元,被配置為,基于所述文檔數據的所述特征和所述執行環境信息,通過將所述元數據施加到所述文檔數據,確定在執行所述讀出處理時使用的參數候選項;以及用戶驗證單元,被配置為向用戶展示所述參數候選項,并接受包括選擇或設定的驗證指令。2.根據權利要求1所述的設備,其特征在于還包括話音合成單元,被配置為使用經由所述用戶驗證單元設定的所述參數生成用于所述文檔數據的朗讀語音。3.根據權利要求1所述的設備,其特征在于還包括用戶設置限制獲取單元,被配置為從用戶獲取具有高于所述元數據的優先權的用戶設置限制。4.根據權利要求3所述的設備,其特征在于所述確定單元考慮到所述用戶設置限制而限制參數能呈現的值或取值范圍。5.根據權利要求3所述的設備,其特征在于允許所述用戶設置限定在所述讀出處理中使用的感情表達的改變范圍、感情類型和語氣、將被讀出的詞或短語以及音量或節奏的變化范圍或值中的至少一個。6.根據權利要求1所述的設備,其特征在于,在提取所述文檔數據的所述特征時,所述提取單元通過概括和施加在所述元數據中描述的對應關系從某些定義生成將被施加到整個相關信息的提取規則。7.根據權利要求1所述的設備,其特征...

    【專利技術屬性】
    技術研發人員:布目光生橘健太郎森纮一郎森田真弘清水勇詞鈴木優
    申請(專利權)人:株式會社東芝
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲精品无码av中文字幕| 免费a级毛片无码a∨免费软件| 亚洲gv猛男gv无码男同短文| 亚洲一区无码中文字幕| 久久久无码精品亚洲日韩按摩| 亚洲精品久久无码av片俺去也| 亚洲AV无码成人精品区大在线| 无码一区二区三区在线观看| 成年男人裸j照无遮挡无码| 亚洲精品无码AV人在线播放| 一本一道VS无码中文字幕| heyzo高无码国产精品| 91精品久久久久久无码 | 狠狠精品干练久久久无码中文字幕| 国产成人无码免费视频97| 日韩精品无码一区二区三区| 无码毛片一区二区三区视频免费播放 | 无码AV中文字幕久久专区| 蕾丝av无码专区在线观看| 亚洲人AV在线无码影院观看| 中国无码人妻丰满熟妇啪啪软件| 成人麻豆日韩在无码视频| 2024你懂的网站无码内射| 亚洲AV日韩AV永久无码绿巨人| 国产成人无码免费视频97 | 无码人妻一区二区三区免费看| 亚洲AV无码乱码在线观看性色扶 | 久久午夜夜伦鲁鲁片免费无码影视| 亚洲成av人片在线观看天堂无码| 亚洲精品无码久久久久A片苍井空| 亚洲欧洲日产国码无码久久99| 五月丁香六月综合缴清无码| 日韩免费无码一区二区视频| 亚洲heyzo专区无码综合| 人妻丰满av无码中文字幕| 久久老子午夜精品无码怎么打| 中文字幕久久精品无码| 国产a级理论片无码老男人| 亚洲AV无码精品色午夜在线观看| 无码国产福利av私拍| 无码人妻精品一区二区三区99性|