本發明專利技術提供了一種圖像文字識別的方法和裝置,其中方法包括:S1、獲取待識別圖像中的文字區域;S2、對所述文字區域進行文字識別;S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息;S4、在返回所述識別結果時,推送包含所述知識信息的知識拓展詞包。本發明專利技術使得用戶在獲取圖像中文字識別結果的同時,能夠獲取到對應的知識信息,而無需進一步通過手工的方式獲得知識信息,顯然更加方便和省力。
【技術實現步驟摘要】
一種圖像文字識別方法和裝置
本專利技術涉及計算機應用
,特別涉及一種圖像文字識別的方法和裝置。
技術介紹
隨著移動互聯網的迅速發展,基于移動終端攝像頭采集到的圖像的應用越來越廣泛。其中圖像文字識別技術將圖像中的文字進行識別,轉換為文本文字,從而減輕了用戶輸入對應文字信息的負擔,方便用戶存儲、編輯對應的文字信息。在實際應用過程中存在如下情況,用戶通過移動終端拍攝的圖像中,有很多是用戶不認識或者用戶了解的文字,例如一些生僻字 、詩詞等,這種情況下,用戶除了想提取這些文字內容之外還想進一步了解文字的知識信息,現有圖像文字識別技術則無法解決該問題,用戶需要通過手工方式進行進一步查詢,例如查詢字典或者手工輸入搜索引擎中進行查詢。
技術實現思路
有鑒于此,本專利技術提供了一種圖像文字識別方法和裝置,以便于方便用戶獲取圖像文字的知識信息。具體技術方案如下一種圖像文字識別的方法,該方法包括SI、獲取待識別圖像中的文字區域;S2、對所述文字區域進行文字識別;S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息;S4、在返回所述識別結果時,推送包含所述知識信息的知識拓展詞包。根據本專利技術一優選實施例,所述步驟SI具體包括服務器接收移動終端發送來的待識別圖像,從所述待識別圖像中提取文字區域;或者,服務器接收移動終端從待識別圖像中提取并發送來的文字區域。根據本專利技術一優選實施例,所述步驟S2具體包括對文字區域進行二值化;對二值化后的文字區域分割為各字塊;提取各字塊的特征信息并與特征數據庫進行匹配,將匹配結果作為各字塊的識別結果;按順序將各字塊的識別結果進行組合得到所述文字區域的識別結果。根據本專利技術一優選實施例,所述步驟S3具體包括以下中的一種或任意組合查詢文字詞典庫獲得文字的讀音、含義、用法或其他語種的翻譯信息;查詢文化知識庫獲得文字對應的典故或出處信息;查詢書籍查詢庫獲得文字對應的書籍信息或網絡資源信息;查詢商品查詢庫獲得文字對應的商品信息;查詢音樂查詢庫獲得文字對應的音樂信息或網絡資源信息;查詢網絡應用搜索庫獲得文字對應的網絡應用信息或網絡入口。根據本專利技術一優選實施例,在所述步驟S3中查詢所有知識庫,將獲得的所有知識信息生成知識拓展詞包;或者,在所述步驟SI中還獲取用戶選擇的個性化選項內容,在所述步驟S3中查詢所述個性化選項內容對應的知識庫,將獲得的知識信息生成知識拓展詞包;或者,在所述步驟S3中查詢所有知識庫,對查詢到的 知識信息進一步確定知識信息對應的權重,將權重值排在前N個的知識信息生成知識拓展詞包,N為預設的正整數。根據本專利技術一優選實施例,所述知識信息對應的權重采用以下方式確定根據知識信息被查詢到的總次數確定該知識信息對應的權重,總次數越大權重值越大;或者, 利用知識信息被查詢到的總次數確定該知識信息對應的知識權重,利用該知識信息所屬類別的所有知識信息被當前用戶查看的總次數確定用戶個性化權重,利用知識信息的知識權重與用戶個性化權重的乘積確定該知識信息對應的權重。一種圖像文字識別的裝置,該裝置包括區域獲取單元,用于獲取待識別圖像中的文字區域;文字識別單元,用于對所述文字區域進行文字識別;知識查詢單元,用于所述文字識別單元的識別結果查詢知識庫獲得識別結果對應的知識信息;結果推送單元,用于在返回所述識別結果時,推送包含所述知識信息的知識拓展詞包。根據本專利技術一優選實施例,所述區域獲取單元接收移動終端發送來的待識別圖像,從所述待識別圖像中提取文字區域;或者,接收移動終端從待識別圖像中提取并發送來的文字區域。根據本專利技術一優選實施例,所述文字識別單元具體執行對文字區域進行二值化,對二值化后的文字區域分割為各字塊,提取各字塊的特征信息并與特征數據庫進行匹配,將匹配結果作為各字塊的識別結果,按順序將各字塊的識別結果進行組合得到所述文字區域的識別結果。根據本專利技術一優選實施例,所述知識查詢單元具體執行以下中的一種或任意組合查詢文字詞典庫獲得文字的讀音、含義、用法或其他語種的翻譯信息;查詢文化知識庫獲得文字對應的典故或出處信息;查詢書籍查詢庫獲得文字對應的書籍信息或網絡資源信息;查詢商品查詢庫獲得文字對應的商品信息;查詢音樂查詢庫獲得文字對應的音樂信息或網絡資源信息;查詢網絡應用搜索庫獲得文字對應的網絡應用信息或網絡入口。根據本專利技術一優選實施例,所述知識查詢單元查詢所有知識庫,將獲得的所有知識信息生成知識拓展詞包;或者,所述區域獲取單元還用于獲取用戶選擇的個性化選項內容,所述知識查詢單元查詢所述個性化選項內容對應的知識庫,將獲得的知識信息生成知識拓展詞包;或者,所述知識查詢單元查詢所有知識庫,對查詢到的知識信息進一步確定知識信息對應的權重,將權重值排在前N個的知識信息生成知識拓展詞包,N為預設的正整數。根據本專利技術一優選實施例,所述知識查詢單元采用以下方式確定所述知識信息對應的權重根據知識信息被查詢到的總次數確定該知識信息對應的權重,總次數越大權重值越大;或者, 利用知識信息被查詢到的總次數確定該知 識信息對應的知識權重,利用該知識信息所屬類別的所有知識信息被當前用戶查看的總次數確定用戶個性化權重,利用知識信息的知識權重與用戶個性化權重的乘積確定該知識信息對應的權重。由以上技術方案可以看出,本專利技術利用文字識別的結果查詢知識庫獲得識別結果對應的知識信息,并包含在知識拓展詞包中連同識別結果一起返回給用戶,使得用戶在獲取圖像中文字識別結果的同時,能夠獲取到對應的知識信息,而無需進一步通過手工的方式獲得知識信息,顯然更加方便和省力。附圖說明圖I為本專利技術實施例一提供的圖像文字識別的方法流程圖;圖2為本專利技術實施例提供的系統示意圖;圖3為本專利技術實施例二提供的圖像文字識別的裝置結構圖;圖4和圖5為本專利技術實施例提供的移動終端的兩個展示效果示意圖。具體實施方式為了使本專利技術的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本專利技術進行詳細描述。實施例一、圖I為本專利技術實施例提供的圖像文字識別的方法流程圖,如圖I所示,該方法可以包括以下步驟步驟101 :獲取待識別圖像中的文字區域。服務器獲取移動終端發送來的包含文字信息的圖像,該圖像可以是移動終端拍攝到的原始圖像,服務器在本步驟中提取待識別圖像中的文字區域。或者,該圖像可以是移動終端拍攝到原始圖像后,提取出待識別圖像中的文字區域后將待識別圖像中的文字區域發送給服務器。在提取文字區域時可以采用現有的方式,去除圖像背景后提取文字區域,可以采用但不限于以下方式方式一、首先根據彩色歐式距離進行彩色游程編碼,然后進行顏色聚類,基于聚類結果進行文字層的生成和選擇,例如保留面積大于一定值的連通域,基于連通域與各顏色聚類中心的歐式距離生成各圖像層面,最后依據各圖像層面的像素個數與該層分割閾值的像素個數的關系確定文字層面、噪聲層面或背景層面,最后取出噪聲層面和背景層面后就得到文字層面,即文字區域。方式二、選擇大量的文字樣本圖像和不含文字的圖片,使用canny算子提取這兩類圖片的邊緣信息作為稀疏表示分類字典的訓練樣本;將兩類訓練樣本輸入分類稀疏表示字典訓練算法得到文字稀疏表示分類字典和非文字稀疏表示分類字典;將待識別圖像轉為灰度圖像,使用canny算子提取灰度圖像的邊緣信息;利用基于分類字典的稀疏表示提取灰度圖像邊緣信息中本文檔來自技高網...
【技術保護點】
一種圖像文字識別的方法,其特征在于,該方法包括:S1、獲取待識別圖像中的文字區域;S2、對所述文字區域進行文字識別;S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息;S4、在返回所述識別結果時,推送包含所述知識信息的知識拓展詞包。
【技術特征摘要】
【專利技術屬性】
技術研發人員:韓鈞宇,丁二銳,吳中勤,文林福,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。