一種基于多邊形檢測的漫畫圖像版面理解系統(tǒng)和方法技術(shù)方案

技術(shù)編號：8489968 閱讀：298 留言：0更新日期：2013-03-28 12:19

本發(fā)明專利技術(shù)公布了一種基于多邊形檢測的漫畫圖像版面理解系統(tǒng)和方法。該方法可以自動識別出組成分鏡邊框的多邊形，并且根據(jù)識別出的多邊形之間的幾何位置關(guān)系判斷分鏡之間的閱讀順序，從而完成漫畫版面理解。通過對于用戶輸入的漫畫圖像進行自動分析，從而獲取漫畫版面中的分鏡，并且根據(jù)識別的分鏡之間的幾何位置關(guān)系判定其閱讀順序，從而使得漫畫圖像能更好地在移動設(shè)備上閱讀。該方法能夠自動理解漫畫版面，解決了目前方法不能處理復雜布局版面的問題，可以提升處理效率和用戶體驗。

全部詳細技術(shù)資料下載

【技術(shù)實現(xiàn)步驟摘要】

本專利技術(shù)屬于文檔處理與計算機視覺領(lǐng)域，涉及。
技術(shù)介紹
隨著電子書，電子報紙期刊等數(shù)字出版物的普及與發(fā)展，為當前數(shù)字出版相關(guān)技術(shù)提出了許多應用需求和挑戰(zhàn)。漫畫是一類特殊的出版物，通常由簡單幽默的畫面組和少量文字組成，深受不同國界不同年齡段的閱讀者喜愛，并且越來越多的讀者開始在數(shù)字終端上閱讀電子漫畫文檔。目前這類電子漫畫文檔通常由紙質(zhì)漫畫書籍逐頁掃描得到，直接以圖像文檔格式或者將圖像轉(zhuǎn)化為PDF文檔格式進行存儲和顯示。一幅漫畫圖像可以被分成若干個獨立的子圖像(每個多邊形邊框以及包圍的部分)。在漫畫制作領(lǐng)域，這些獨立的子圖像常常被稱為“分鏡”，由兩部分組成1)角色的畫面展示，對應于子圖像中的圖像內(nèi)容部分；2)角色的語言展示即對白，即子圖像中的字符塊部分。目前漫畫書籍在創(chuàng)作時是以普通紙質(zhì)書籍的頁面大小進行排版設(shè)計的。這樣導致了一個問題，當用戶在屏幕較小的終端(例如智能手機)上閱讀對應的漫畫圖像時，無法完整清晰地觀看整個漫畫圖像，需要上下左右來回拖動畫面，閱讀體驗非常差，這一問題嚴重制約了漫畫產(chǎn)業(yè)數(shù)字化進程。為了克服上述的問題，相關(guān)的解決方案在文獻“M. Yamada et al. ComicImageDecomposition for Reading Comics on Cellular Phones.1EEE Trans.oninformation and systems, 2004”中第一次被提出，該方案是將漫畫圖像預先分割成一個個分鏡，在顯示時按閱讀順序依次顯示各個分鏡。針對第二種解決方案，一些研究人員對使用計算機自動完成上述任務(wù)(下文簡稱為漫畫圖像...

【技術(shù)保護點】
一種基于多邊形檢測的漫畫圖像版面理解系統(tǒng)，其特征是，包括：直線段檢測模塊、多邊形檢測模塊；其中，所述直線段檢測模塊，用于識別漫畫圖像中的直線段，并且記錄這些直線段的位置信息；所述多邊形檢測模塊，根據(jù)直線段檢測模塊檢測的結(jié)果，對直線段進行拼接，識別出完整的多邊形，并且用識別出的多邊形作為對應分鏡的位置信息；該模塊和直線段檢測模塊共同完成分鏡的識別與提取。

【技術(shù)特征摘要】

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：李鹿原，王勇濤，湯幟，
申請(專利權(quán))人：北京大學，
類型：發(fā)明
國別省市：

全部詳細技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)