• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種結合字符級分類和字符串級分類的文本檢測和識別方法技術

    技術編號:8656163 閱讀:165 留言:0更新日期:2013-05-01 23:52
    本發明專利技術公開了一種結合字符級和字符串級分類的文本檢測和識別方法,在圖像中提取可能屬于同一字符的像素集形成備選字符;濾除不滿足字符幾何特征統計規律的備選字符;采用基于字符旋轉和尺度不變性特征的字符級分類器對備選字符分類,以確定備選字符為某字符的概率;將字符兩兩合并形成初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩字符串合并成新的字符串,直到沒有可再合并的字符串;采用基于字符串結構特征的字符串級分類器對字符串分類,以確認具有語意的字符串;利用待識別字符為某一字符的概率對字符串識別,得到語意文本。本發明專利技術將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結果精度,簡單高效。

    【技術實現步驟摘要】

    本專利技術屬于計算機視覺
    ,更具體地,涉及。
    技術介紹
    在當今信息爆炸年代,運用計算機視覺技術從視覺信息(圖片、視頻等)中快速有效地分析和提取出有用信息變得越來越重要。文本檢測和識別就是判斷輸入的自然場景圖像中是否存在文本,如果存在,則標記其位置,然后對這些文本進行語意識別。自然圖像中的文本檢測和識別是計算機視覺
    中重要研究課題之一,有著廣泛應用,例如機器人導航、圖像檢索、人機交互等。在過去的幾十年里,文本檢測和識別技術研究取得了長足進步,其主要有兩類一類是只進行文本檢測或只進行文本識別;一種是將兩者分開處理構成一個識別系統。但上述兩類方法基本都集中在水平方向文本的檢測和識別,其無法解決文本多樣性問題和復雜背景問題。
    技術實現思路
    針對現有技術的缺陷,本專利技術的目的在于提供,該方法將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結果精度,簡單高效。一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟(I)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串;(5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串;(6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。進一步地,所述步驟(2)中的字符幾何特征統計規律具體為字符c的寬度WV(C)變化范圍為[O, I],高寬比AR(C)變化范圍為,占空比OR(C)變化范圍為,其中,本文檔來自技高網...

    【技術保護點】
    一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟:(1)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串;(5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串;(6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。

    【技術特征摘要】
    1.一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟: (O依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符; (2)濾除不滿足字符幾何特征統計規律的備選字符; (3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符; (4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串; (5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串; (6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。2.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(2)中的字符幾何特征統計規律具體為:字符c的寬度WV(C)變化范圍為[O,1],高寬比AR(C)變化范圍為,占空比OR(C)變化范圍為,其中,3.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(3)中基于字符旋轉和尺度不變性特征的字符級分類器構建方法具體為: (31)提取訓練樣本字符c的基本信息,包括重心0(c)、長軸L(C)、...

    【專利技術屬性】
    技術研發人員:白翔姚聰蔡超劉文予
    申請(專利權)人:華中科技大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费无码作爱视频| 极品粉嫩嫩模大尺度无码视频 | 亚洲中文字幕无码久久2020| 国产AV无码专区亚洲A∨毛片| AV无码精品一区二区三区| yy111111少妇影院无码| 亚洲精品无码专区| 无码少妇一区二区性色AV| 日产无码1区2区在线观看| 亚洲熟妇无码久久精品| 成人无码区免费A∨直播| 九九在线中文字幕无码| 精品无码国产自产拍在线观看| 亚洲伊人成无码综合网| 无码少妇A片一区二区三区| 无码国产伦一区二区三区视频| 亚洲AV无码一区二区三区在线观看| 精品多人p群无码| 人妻丰满熟妇AV无码区乱| 亚洲AV无码乱码在线观看裸奔| 狠狠精品久久久无码中文字幕 | 亚洲精品无码乱码成人| 亚洲精品无码日韩国产不卡?V | 亚洲VA中文字幕无码毛片| 国产成人无码免费看片软件| 久久亚洲中文无码咪咪爱| 亚洲中文无码永久免| 亚洲av无码兔费综合| 国产精品无码无卡在线观看久 | 亚洲av激情无码专区在线播放 | 免费无码又爽又刺激聊天APP| 亚洲av无码久久忘忧草| 人妻av无码一区二区三区| 久久人妻少妇嫩草AV无码专区 | 久久久久久国产精品无码超碰 | 无码熟妇人妻在线视频| 少妇爆乳无码专区| 狼人无码精华AV午夜精品| 特级无码a级毛片特黄| 欧洲精品无码一区二区三区在线播放| 亚洲人成人无码网www国产|