一種圖像文字識別方法和裝置制造方法及圖紙

技術編號：8161773 閱讀：284 留言：0更新日期：2013-01-07 19:39

本發明專利技術提供了一種圖像文字識別的方法和裝置，其中方法包括：S1、獲取待識別圖像中的文字區域；S2、對所述文字區域進行文字識別；S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息；S4、在返回所述識別結果時，推送包含所述知識信息的知識拓展詞包。本發明專利技術使得用戶在獲取圖像中文字識別結果的同時，能夠獲取到對應的知識信息，而無需進一步通過手工的方式獲得知識信息，顯然更加方便和省力。

全部詳細技術資料下載

【技術實現步驟摘要】
一種圖像文字識別方法和裝置
本專利技術涉及計算機應用
，特別涉及一種圖像文字識別的方法和裝置。
技術介紹
隨著移動互聯網的迅速發展，基于移動終端攝像頭采集到的圖像的應用越來越廣泛。其中圖像文字識別技術將圖像中的文字進行識別，轉換為文本文字，從而減輕了用戶輸入對應文字信息的負擔，方便用戶存儲、編輯對應的文字信息。在實際應用過程中存在如下情況，用戶通過移動終端拍攝的圖像中，有很多是用戶不認識或者用戶了解的文字，例如一些生僻字、詩詞等，這種情況下，用戶除了想提取這些文字內容之外還想進一步了解文字的知識信息，現有圖像文字識別技術則無法解決該問題，用戶需要通過手工方式進行進一步查詢，例如查詢字典或者手工輸入搜索引擎中進行查詢。
技術實現思路
有鑒于此，本專利技術提供了一種圖像文字識別方法和裝置，以便于方便用戶獲取圖像文字的知識信息。具體技術方案如下一種圖像文字識別的方法，該方法包括SI、獲取待識別圖像中的文字區域；S2、對所述文字區域進行文字識別；S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息；S4、在返回所述識別結果時，推送包含所述知識信息的知識拓展詞包。根據本專利技術一優選實施例，所述步驟SI具體包括服務器接收移動終端發送來的待識別圖像，從所述待識別圖像中提取文字區域；或者，服務器接收移動終端從待識別圖像中提取并發送來的文字區域。根據本專利技術一優選實施例，所述步驟S2具體包括對文字區域進行二值化；對二值化后的文字區域分割為各字塊；提取各字塊的特征信息并與特征數據庫進行匹配，將匹配結果作為各字塊的識別結果;按順序將各字塊的識別結果進行組合得到所述文字...

【技術保護點】
一種圖像文字識別的方法，其特征在于，該方法包括：S1、獲取待識別圖像中的文字區域；S2、對所述文字區域進行文字識別；S3、利用識別結果查詢知識庫獲得識別結果對應的知識信息；S4、在返回所述識別結果時，推送包含所述知識信息的知識拓展詞包。

【技術特征摘要】

【專利技術屬性】
技術研發人員：韓鈞宇，丁二銳，吳中勤，文林福，
申請(專利權)人：北京百度網訊科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術