The invention discloses a two value method, a device and a terminal of an image. The invention only needs to be processed through a variety of highly complementary image binarization method respectively, and then through the use of optical character recognition engine based on learning confidence of individual characters, and then calculates the text confidence, can dynamically select the optimal processing results. Without the care of global information or local texture, seamless handover of processing results of various two valued methods can be realized. The invention can dynamically select the optimum two value result in different scenes, thus satisfying the diversity requirement of different scenes, and realizing the full scene adaptation of two valued pictures.
【技術實現步驟摘要】
一種圖片的二值化方法、裝置及終端
本專利技術涉及圖像處理領域,尤其涉及一種圖片的二值化方法、裝置及終端。
技術介紹
圖像的二值化,就是將圖像上的像素點的灰度值設置為0或255,從而將整個圖像呈現出明顯的只有黑和白的視覺效果。二值化是圖像處理的基本操作,其應用非常廣泛,相應地,現有技術中也有相當多的二值化方法,比如雙峰法、P參數法、迭代法和最大類間方差法等。然而,現有的二值化方案,都是基于固定規則的圖片場景對圖片進行二值化,不具有普適性,因此目前還沒有適配所有場景的二值化方法。二值化方法的多樣性和每個二值化方法的局限性導致了在需要對多種場景的圖片進行二值化時,難以快速找到適合的二值化方法,從而影響了圖片的二值化效果。
技術實現思路
為了解決上述技術問題,本專利技術提出了一種圖片的二值化方法、裝置及終端。本專利技術具體是以如下技術方案實現的:第一方面,提供了一種圖片的二值化方法,所述方法包括:獲取待處理圖片,所述待處理圖片中包含文字;分別使用多個預設的二值化處理方法對所述待處理圖片進行獨立的二值化處理,每個二值化方法得到一個處理結果;根據所述處理結果,得到處理結果集合;計算所述處理結果集合中的每一個處理結果的文字置信度;選取文字置信度最高的處理結果作為對所述待處理圖片的二值化結果。第二方面,提供了一種圖片的二值化裝置,所述裝置包括:待處理圖片獲取模塊,用于獲取待處理圖片;處理結果得到模塊,用于分別使用多個預設的二值化處理方法對所述待處理圖片進行獨立的二值化處理,每個二值化方法得到一個處理結果;處理結果集合得到模塊,用于根據所述處理結果,得到處理結果集合;文字置信度 ...
【技術保護點】
一種圖片的二值化方法,其特征在于,所述方法包括:獲取待處理圖片,所述待處理圖片中包含文字;分別使用多個預設的二值化處理方法對所述待處理圖片進行獨立的二值化處理,每個二值化方法得到一個處理結果;根據所述處理結果,得到處理結果集合;計算所述處理結果集合中的每一個處理結果的文字置信度;選取文字置信度最高的處理結果作為對所述待處理圖片的二值化結果。
【技術特征摘要】
1.一種圖片的二值化方法,其特征在于,所述方法包括:獲取待處理圖片,所述待處理圖片中包含文字;分別使用多個預設的二值化處理方法對所述待處理圖片進行獨立的二值化處理,每個二值化方法得到一個處理結果;根據所述處理結果,得到處理結果集合;計算所述處理結果集合中的每一個處理結果的文字置信度;選取文字置信度最高的處理結果作為對所述待處理圖片的二值化結果。2.根據權利要求1所述的方法,其特征在于,所述計算所述處理結果集合中的每一個處理結果的文字置信度包括:獲取處理結果中每一個文字的置信度;根據預設的文字置信度算法和每一個文字的置信度計算所述處理結果的文字置信度。3.根據權利要求2所述的方法,其特征在于,所述獲取處理結果中每一個文字的置信度包括:將所述處理結果輸入預設的基于光學字符識別的學習引擎;得到所述學習引擎輸出的置信度。4.根據權利要求2所述的方法,其特征在于,所述根據預設的文字置信度算法和每一個文字的置信度計算所述處理結果的文字置信度包括:設定處理結果中每一個文字對應的權值;計算所述處理結果的加權平均置信度:根據每一個文字的置信度和所述文字對應的權值對置信度進行加權求和;由加權求和的結果除以所述處理結果中的文字的數量得到加權平均置信度;將所述加權平均置信度作為文字置信度。5.根據權利要求1所述的方法,其特征在于,所述預設的二值化處理方法包括基于滑動窗的二值化方法和基于顏色值統計的二值化方法。6.根據權利要求5所述的方法,其特征在于,所述基于滑動窗的二值化方法包括:將窗口設置于所述待處理圖片的預設位置;判斷所述窗口內的像素與相關像素是否屬于連續的圖案;所述相關像素為窗口外與所述窗口相鄰的像素;若否,則對所述窗口內的像素進行局部二值化;判斷所述窗口是否到達所述預設軌跡的終點;若否,則按照預設軌跡滑動所述窗口;返回判斷所述窗口內的像素與窗口外的相鄰像素是否屬于連續的圖案的步驟。7.根據權利要求6所述的方法,其特征在于,所述局部二值化包括:得到窗口內的像素的顏色分布統計結果;根據所述統計結果設定閾值,所述閾值用于區分所述待處理圖片的前景和背景;根據所述閾值對所述窗口內的像素進行二值化。8.根據權利要求5所述的方法,其特征在于,所述基于顏色值統計的二值化方法包括:得到所述待處理圖片的像素的顏色分布統計結果;基于所述顏色分布統計結果,使用預設的顏色聚類算法得到兩個目標顏色;根據所述兩個目標顏色設定前景顏色和背景顏色;依次計算所述待處理圖片的像素的第一距離和第二距離,并根據計算結果判定所述像素的歸屬;所述第一距離為所述像素的顏色與所述前景顏色之間的歐幾里得距離,所述第二距離為所述像素顏色與所述背景顏色之間的歐幾里得距離;根據所述判定結果對所述待處理圖片中的像素進行二值化。9.根據權利要求8所述的方法,其特征在于,所述依次計算所述待處理圖片的像素的第...
【專利技術屬性】
技術研發人員:劉銀松,郭安泰,
申請(專利權)人:騰訊科技上海有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。