The invention provides a text image generation method, device and terminal, the invention can be achieved by the use of color clustering algorithm randomly generated a background color and text color, so as to make up for the existing technology is the binarization of text image and the preset colors lack of simple mixing caused by single color and diversity the. By the image affine transformation, transmission transformation and Gauss transform, the image is added to the natural environment to capture the text of the image of the unique effect, so that the processed image is more realistic. The invention can produce large amount of data and high fidelity text images, thereby alleviating the shortage of the training sample of the depth learning engine, and making the trained depth learning engine have better generalization ability.
【技術實現步驟摘要】
一種文字圖像生成方法、裝置及終端
本專利技術涉及圖像處理領域,尤其涉及一種文字圖像生成方法、裝置及終端。
技術介紹
深度學習引擎可以應用于圖片文字識別領域。現有的深度學習引擎大多基于神經網絡,通過訓練神經網絡使得深度學習引擎具有準確識別出圖片中的文字的能力。為訓練神經網絡需要大量的訓練樣本,但是現有的通過文本與預設圖像合成的訓練樣本一般只是將在二值化的文字圖像與預設的顏色進行簡單的混合,請參考圖1,圖1(a)和圖1(b)均是混合后的文字圖像,這種混合導致訓練樣本的顏色單一和多樣性差,從而無法滿足深度學習引擎對訓練數據多樣性的要求。進一步地,在自然環境中拍攝到的文字圖像通常具有一些特定的效果,比如文字的邊緣顏色出現變化或者文字存在畸變,比如文字為傾斜的或者旋轉的,而這些效果只通過簡單的混合難以進行模擬,從而使得訓練樣本中的圖像不自然,進而顯著影響深度學習引擎的泛化能力。
技術實現思路
為了解決上述技術問題,本專利技術提出了一種文字圖像生成方法、裝置及終端。本專利技術具體是以如下技術方案實現的:第一方面,一種文字圖像生成方法,所述方法包括:基于矢量字體和目標文字獲取所述目標文字的二值化圖像;從預設的彩色圖片集中獲取聚類圖片集,根據所述聚類圖片集聚類得到第一目標顏色、第二目標顏色和第三目標顏色;根據所述第一目標顏色、第二目標顏色和第三目標顏色對所述二值化圖像進行著色以獲取彩色圖像;對所述彩色圖像按照第一預設規則進行仿射變換;對經過仿射變換后的彩色圖像按照第二預設規則進行透視變換;為經過透視變換后的彩色圖像加入噪聲以得到所述目標文字的目標圖像。第二方面,一種文字圖像生 ...
【技術保護點】
一種文字圖像生成方法,其特征在于,所述方法包括:基于矢量字體和目標文字獲取所述目標文字的二值化圖像;從預設的彩色圖片集中獲取聚類圖片集,根據所述聚類圖片集聚類得到第一目標顏色、第二目標顏色和第三目標顏色;根據所述第一目標顏色、第二目標顏色和第三目標顏色對所述二值化圖像進行著色以獲取彩色圖像;對所述彩色圖像按照第一預設規則進行仿射變換;對經過仿射變換后的彩色圖像按照第二預設規則進行透視變換;為經過透視變換后的彩色圖像加入噪聲以得到所述目標文字的目標圖像。
【技術特征摘要】
1.一種文字圖像生成方法,其特征在于,所述方法包括:基于矢量字體和目標文字獲取所述目標文字的二值化圖像;從預設的彩色圖片集中獲取聚類圖片集,根據所述聚類圖片集聚類得到第一目標顏色、第二目標顏色和第三目標顏色;根據所述第一目標顏色、第二目標顏色和第三目標顏色對所述二值化圖像進行著色以獲取彩色圖像;對所述彩色圖像按照第一預設規則進行仿射變換;對經過仿射變換后的彩色圖像按照第二預設規則進行透視變換;為經過透視變換后的彩色圖像加入噪聲以得到所述目標文字的目標圖像。2.根據權利要求1所述的方法,其特征在于,所述基于矢量字體和目標文字獲取所述目標文字的二值化圖像包括:基于矢量字體和目標文字獲取包括所述目標文字的圖像;以黑色為背景色,以白色為前景色渲染所述圖像以得到所述目標文字的二值化圖像。3.根據權利要求1所述的方法,其特征在于,所述聚類圖片集包括一張或多張用于進行聚類的圖片。4.根據權利要求3所述的方法,其特征在于,所述根據所述聚類圖片集聚類得到第一目標顏色、第二目標顏色和第三目標顏色包括:根據預設的聚類方法對所述聚類圖片集中的圖片進行聚類以得到聚類結果;在所述聚類結果中選取第一目標顏色、第二目標顏色和第三目標顏色。5.根據權利要求4所述的方法,其特征在于,所述根據預設的聚類方法對所述聚類圖片集中的圖片進行聚類以得到聚類結果包括:在所述聚類圖片集中選取用于聚類的圖片;在所述圖片中確定目標聚類個數k;在所述圖片中選取k個顏色作為初始聚類中心;將所述圖片中的每個像素分配至最近的初始聚類中心,形成k個簇:獲取所述像素的顏色與初始聚類中心的歐幾里得距離;獲取所述歐幾里得距離的最小值;將所述像素劃分至所述最小值對應的初始聚類中心;計算k個簇中每個簇的聚類中心直至所述k個簇中任意一個簇中的所有像素的顏色到該任意一個簇的聚類中心的距離平方和達到最小值。6.根據權利要求5所述的方法,其特征在于,所述在所述圖片中選取k個顏色作為初始聚類中心包括:利用所述圖片中的像素的顏色形成k個集群的層次聚類;將層次聚類的k個集群的質心作為初始聚類中心。7.根據權利要求1所述的方法,其特征在于,根據所述第一目標顏色、第二目標顏色和第三目標顏色對所述二值化圖像進行著色以獲取彩色圖像包括:根據所述第一目標顏色設置所述二值化圖像中的文字顏色;根據所述第二目標顏色設置所述二值化圖像中的背景色;根據所述第三目標顏色設置所述二值化圖像中的文字邊緣顏色。8.根據權利要求1所述的方法,其特征在于,所述對所述彩色圖像按照第一預設規則進行仿射變換包括:設置旋轉角度的變換范圍和傾斜角度的變換范圍;按照預設選取規則選取符合所述旋轉角度的變換范圍的旋轉角度和符合所述傾斜角度的變換范圍的傾斜角度;根據所述旋轉角度和所述傾斜角度獲取仿射變換矩陣;根據所述仿射變換矩陣對所述彩色圖像進行仿射變換。9.根據權利要求1所述的方法,其特征在于,所述為經過透視變換后的彩色圖像加入噪聲以得到所述目標文字的目標圖像包括:對經過透視變換后的彩色圖像按照第三預設規則加入噪聲;根據加入噪聲后的圖像與加入噪聲前的圖像...
【專利技術屬性】
技術研發人員:李輝,
申請(專利權)人:騰訊科技上海有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。