本發明專利技術提供了一種對圖像進行字符識別的方法和裝置。所述方法包括:從待處理圖像找出目標字符的邊緣輪廓;在對所述目標字符進行二值化處理時,針對所述目標字符的邊緣輪廓中的各個像素點,分別作為當前像素點,判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像;若所述當前像素點屬于所述目標字符,則針對所述當前像素點進行二值化處理;對進行二值化處理的圖像進行字符識別。本發明專利技術可以減少圖像處理的噪點,提高圖像處理的速度。
【技術實現步驟摘要】
【專利摘要】本專利技術提供了一種對圖像進行字符識別的方法和裝置。所述方法包括:從待處理圖像找出目標字符的邊緣輪廓;在對所述目標字符進行二值化處理時,針對所述目標字符的邊緣輪廓中的各個像素點,分別作為當前像素點,判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像;若所述當前像素點屬于所述目標字符,則針對所述當前像素點進行二值化處理;對進行二值化處理的圖像進行字符識別。本專利技術可以減少圖像處理的噪點,提高圖像處理的速度。【專利說明】一種對圖像進行字符識別的方法和裝置
本專利技術涉及字符識別領域,特別是涉及一種對圖像進行字符識別的方法,以及,一種對圖像進行字符識別的裝置。
技術介紹
OCR (Optical Character Recognit1n,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查字符載體,比如紙上的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程,包括圖像的預處理、字符的二值化、版面分析、字符切割和字符識別幾個步驟。 其中,圖像的二值化是光學字符識別的重要步驟。圖像二值化通常采用的方法是,針對待處理的圖像計算一張閾值平面,然后根據閾值平面將圖像中的各像素點進行二值分割。NiBlack方法是一種二值化閾值的計算方法,它以局部開窗口的方式為每個像素點計算一個閾值,能夠較好地處理亮度不均勻的待處理圖像。但是NiBlack方法所開的窗口大小是固定的,不能根據字符作自適應調整,處理后的圖像噪點比較多。另外,NiBlack方法針對圖像中的字符位置與背景位置的每個像素點都要計算閾值,所以耗時比較長。 綜上所述,在光學字符識別中,現有的圖像的二值化處理方法存在耗時長、噪點多以及不能自適應地在字符周圍開小窗口進行處理的問題。
技術實現思路
本專利技術提供了一種對圖像進行字符識別的方法和裝置,以減少圖像處理的噪點,提高圖像處理的速度。 本專利技術提供了一種對圖像進行字符識別的方法,包括: 從待處理圖像找出目標字符的邊緣輪廓; 在對所述目標字符進行二值化處理時,針對所述目標字符的邊緣輪廓中的各個像素點,分別作為當前像素點,判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像; 若所述當前像素點屬于所述目標字符,則針對所述當前像素點進行二值化處理; 對進行二值化處理的圖像進行字符識別。 優選地,所述從待處理圖像找出目標字符的邊緣輪廓包括: 對待處理圖像中包含的各個像素點,對相鄰的兩個像素點的像素值進行比較; 若相鄰兩個像素點的像素值的差值大于預設閥值,則將像素值較大的像素點所在位置作為所述目標字符的邊緣輪廓。 優選地,所述從待處理圖像找出目標字符的邊緣輪廓還包括: 針對得到的邊緣輪廓,做出所述邊緣輪廓的水平外接矩形; 查找所述待處理圖像中與所述水平外接矩形重合的部分以及與所述最小外界矩形距離2個像素以內的區域,將查找的區域合并入所述邊緣輪廓。 優選地,所述判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像包括: 以所述當前像素點為中心,以預設邊長確定一個正方形的閥值區域; 根據所述閥值區域內所有像素點的亮度統計所述閥值區域內亮度的比較值; 將所述當前像素點的亮度與所述比較值進行比較,若所述當前像素點的亮度大于所述比較值,則所述當前像素點為屬于所述目標字符的背景圖像,若所述當前像素點的亮度不大于所述比較值,則所述當前像素點為屬于所述目標字符。 優選地,所述根據所述閥值區域內所有像素點的亮度統計所述閥值區域內亮度的比較值包括: 在所述閥值區域內計算每個像素點的梯度值,包括:計算所述像素點的左邊像素點的亮度與右邊像素點的亮度的第一絕對差值以及所述像素點的上邊像素點的亮度與下邊像素點的亮度的第二絕對差值,將所述第一絕對差值和所述第二絕對差值中最大的值作為所述梯度值; 計算所述閥值區域內所有像素點的梯度值的和; 計算所述閥值區域內各個像素點的亮度分別與所述梯度值的乘積的和,并除以所述梯度值的和,減去預設閥值的差作為所述比較值。 優選地,所述方法還包括: 計算所述目標字符的字符筆畫的寬度作為所述預設邊長,進一步包括: 對所述目標字符的邊緣輪廓按照預設的方向進行掃描; 統計每次掃描出現的相鄰輪廓之間的距離值,并將出現次數最多的距離值作為所述目標字符的字符筆畫的寬度。 本專利技術還提供了一種對圖像進行字符識別的裝置,包括: 輪廓查找模塊,用于從待處理圖像找出目標字符的邊緣輪廓; 像素點判斷模塊,用于在對所述目標字符進行二值化處理時,針對所述目標字符的邊緣輪廓中的各個像素點,分別作為當前像素點,判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像; 二值化處理模塊,用于針對屬于所述目標字符的當前像素點進行二值化處理; 字符識別模塊,用于對進行二值化處理的圖像進行字符識別。 優選地,所述輪廓查找模塊包括: 像素值比較子模塊,用于對待處理圖像中包含的各個像素點,對相鄰的兩個像素點的像素值進行比較; 像素值判斷子模塊,用于若相鄰兩個像素點的像素值的差值大于預設閥值,則將像素值較大的像素點所在位置作為所述目標字符的邊緣輪廓。 優選地,所述輪廓查找模塊還包括: 矩形確定子模塊,用于針對得到的邊緣輪廓,做出所述邊緣輪廓的水平外接矩形; 區域查找子模塊,用于查找所述待處理圖像中與所述水平外接矩形重合的部分以及與所述最小外界矩形距離2個像素以內的區域; 區域合并子模塊,用于將查找的區域合并入所述邊緣輪廓。 優選地,所述像素點判斷模塊包括: 閥值區域確定子模塊,用于以所述當前像素點為中心,以預設邊長確定一個正方形的閥值區域; 比較值統計子模塊,用于根據所述閥值區域內所有像素點的亮度統計所述閥值區域內亮度的比較值; 亮度比較子模塊,用于將所述當前像素點的亮度與所述比較值進行比較,若所述當前像素點的亮度大于所述比較值,則所述當前像素點為屬于所述目標字符的背景圖像,若所述當前像素點的亮度不大于所述比較值,則所述當前像素點為屬于所述目標字符。 與
技術介紹
相比,本專利技術包括以下優點: 本專利技術實施例通過確定目標字符的邊緣輪廓,進一步判斷邊緣輪廓內的各個像素點為背景像素點還是屬于字符的像素點,僅針對屬于目標字符的當前像素點進行二值化處理,依據本專利技術實施例,一方面在對圖像進行局部二值化處理時,僅僅針對有字符的地方進行二值化處理,沒有字符的地方不進行二值化處理,節約了大量的處理資源,加快了圖像處理的速度。另一方面在對圖像進行局部二值化時,所開的窗口與字符相關,能夠根據字符作自適應調整,噪點少,二值化效果較好。 【專利附圖】【附圖說明】 圖1是本專利技術實施例的一種對圖像進行字符識別的方法的流程圖; 圖2是本專利技術實施例的一個示例中待處理圖像; 圖3是對待處理圖像進行找輪廓及輪廓合并后得到的字符的輪廓圖像; 圖4是本專利技術實施例的一個示例中選取A點為當前點的待處理圖像; 圖5是本專利技術實施例的一個示例中選選取A點為當前點的字符輪廓圖; 圖6是本專利技術實施例的一個示例中選取B點為當前點的待本文檔來自技高網...

【技術保護點】
一種對圖像進行字符識別的方法,其特征在于,包括:從待處理圖像找出目標字符的邊緣輪廓;在對所述目標字符進行二值化處理時,針對所述目標字符的邊緣輪廓中的各個像素點,分別作為當前像素點,判斷所述當前像素點屬于所述目標字符還是屬于所述目標字符的背景圖像;若所述當前像素點屬于所述目標字符,則針對所述當前像素點進行二值化處理;對進行二值化處理的圖像進行字符識別。
【技術特征摘要】
【專利技術屬性】
技術研發人員:李健,蘭志才,張連毅,武衛東,
申請(專利權)人:北京捷通華聲語音技術有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。