一種交互式數據庫結構和搜索系統,采用文本搜索和圖像特征提取,以便根據外表自動將文件組合在一起。系統自動確定文件圖像的直觀特性,根據它們的文件圖像的相對相似性將文件組合在一起。(*該技術在2018年保護過期,可自由使用*)
【技術實現步驟摘要】
本專利技術涉及文件管理系統,特別是提供一種通過一個文件圖像數據庫導航(navigating)的方法。文件圖像的低成本、大容量電存儲的增加使得用戶在電子信息聯機時不斷保存以前以硬拷貝格式存儲的數量和種類總是在增加的文件。由于該存儲技術的變革降低了文件存儲的成本,需要更有效的方法通過對眾多聯機文件搜索找到用戶感興趣的一個特定文件或一組文件。查找感興趣的文件充其量是最基本的。在這些方法中,典型的方法是將文件掃描進計算機,并由一光符號識別(Optical Character Recognition,OCR”)程序將圖像轉變成文本文件。接著,以掃描所有文件的全部文本或由最初將文件分類的一個人仔細選擇后認為是該文件有代表性的一組關鍵字的系統來執行一關鍵字匹配搜索方式。第一步的問題在于,全面瀏覽大量文件時會造成高的搜索成本。第二步的困難在于,不同的人會采用不同的策略來整理文件和檢索。當數據庫內包含的文件的非均勻性增大時,這些傳統搜索方法的可靠性就會降低。認識到有機會開發文件圖像部分的信息內容,進行了幾種根據文件中包含的小圖像的匹配對文件進行搜索的嘗試。例如,M.Y.Jaisimha、A.Bruce和T.Nguyen在他們的著作“文件瀏覽一種用于對退化文件圖像數據的文本和圖像查詢的系統(DocBrowse:A System for Textual and Graphical Queryingon Degraded Document Image Data)”中描述這樣一個系統,它根據印在信紙上端的公司縮略名搜尋文件。D.Doermann等在“用于智能文件檢索的通用主機的研制(Development of a General Framework for Intelligent DocumentRetrieval)”中概括地論述了一個根據圖像描述符的產生和匹配來匹配文件的系統,該圖像描述符描述了一個文件的低級特征和高級結構。使人遺憾的是,該方法要求圖像信息的集中處理,大大地限制了其在大多數商業應用中的使用。雖然,這一方法通過圖像特征向量提供了文件搜索能力,但是它們沒有提供一種有效的方法來組織一個大的文件圖像數據庫。這些和其他缺點表明,所需要的是一種有效搜索文件圖像數據庫的方法和系統。此方法根據文件圖像的文本以及視覺特性通過組織該數據庫來加快搜索。本專利技術提供一種交互式數據庫結構和搜索系統,它采用文本搜索和圖像特征提取來自動根據外表將文件組合起來。該系統自動確定文件圖像的視覺特性并根據它們的文件圖像的相對相似性將文件收集起來。一個典型實施例是一種方法,該方法包括步驟接受來自用戶的一文本串關鍵字作為一初始搜索的基礎;在關鍵字數據庫中搜索文件圖像的文本成分;根據從文件圖像的壓縮表示中提取的特征的處理,將具有包含關鍵字的文本成分的文件圖像組合(group)成文件圖像群(cluster);顯示每個文件圖像群的一代表文件圖像;以及,接受表示一特定文件圖像群的用戶輸入,系統據此執行進一步搜索。另一典型實施例是一種方法,該方法包括步驟根據特征信息將文件圖像集合起來構成具有相似特征的文件圖像群;從每個文件圖像群中選擇一代表文件圖像;顯示給用戶該代表文件圖像;以及,接受用戶輸入以選擇一圖像群,系統據此執行進一步搜索。一相關實施例在執行上述的集合步驟之前從壓縮圖像提取特征信息。另一相關實施例還允許用戶指定一期望的群數。通過參照以下結合下面附圖進行的詳細描述,將更好地理解本專利技術。附圖說明圖1表示一實施本專利技術的典型計算機系統。圖2A表示描述本專利技術一個最佳實施例中的數據庫的典型查詢操作的流程圖。圖2B表示描述本專利技術另一個實施例中的數據庫的典型查詢操作的流程圖。圖3A表示本專利技術另一個最佳實施例中組織該數據庫的執行步驟的流程圖。圖3B表示本專利技術另一個實施例中組織該數據庫的執行步驟的流程圖。圖4為系統采用壓縮圖像文件以利于低成本存儲和圖像成分的方便操作的示圖。圖5表示從壓縮圖像提取圖像特征信息作為圖像集合的基礎。圖6表示從低頻圖像信息提取統計動差(moments)。圖7表示從高頻圖像信息提取字數和圖像數的連通分量。圖8表示從高頻圖像信息提取列數的連通分量。圖9表示本專利技術的文件圖像縮圖的群。圖10表示本專利技術的采用網絡瀏覽器(web browser)實現顯示以及用戶接口部分。在典型的裝置中,本專利技術將用于一具有基本子系統的計算機系統中,如圖1所示。在圖1所示的典型系統中,計算機系統10包括互連主要子系統的總線12,這些子系統包括中央處理器14、系統存儲器16、輸入/輸出(I/O)控制器18、如通過并行端口22的打印機20等外設、通過顯示適配器26的顯示屏24、串行端口28、鍵盤30、固定盤驅動器32,以及用于接收軟盤33A的軟磁盤驅動器33??梢赃B接許多其他裝置,如通過外部接口36連接的掃描裝置34、通過串行端口28連接的鼠標38以及直接連接的觸摸屏40??梢砸酝瑯臃绞竭B接許多其他裝置或子系統(未顯示)。而且如下所述,不必為了實施本專利技術而出現圖1所示所有裝置。這些裝置和子系統可以以與圖1所示的不同方式互連,而不會影響該系統的工作。一個如圖1所示的計算機系統的工作是該領域已熟知的,在本申請中不作詳細論述。實現本專利技術的源代碼可操作地置于系統存儲器16內或存儲在如固定盤32或軟盤33A的存儲媒體上。一圖像數據庫也可存儲在固定盤32上。顯示屏24與標準計算機如采用一CRT顯示屏或監視器的個人計算機、工作站或主機中使用的相同。各種形式的用戶輸入裝置可用于本專利技術。例如,鼠標輸入裝置38使用戶隨著其手在一標準用戶輸入裝置內的移動來移動一顯示在顯示屏上的指示器(pointer)。鼠標的表面通常包括一個或多個按鈕,使用戶通過移動鼠標指向屏幕上的一目標并選定該目標,或者按下鼠標上一個或多個按鈕以激活該目標。另外,觸摸屏使用戶指向屏幕上的目標以選定一目標,并通過指向屏幕上的第二位置移動該選定的目標。為了采用鼠標或觸摸屏來激活,可在屏幕上顯示不同的按鈕和控制器。固定盤驅動器32可以是一硬盤驅動器或一光盤驅動器,或任何適于存儲文件圖像的數據庫的存儲媒體。完成圖像數據庫查詢操作的概述本專利技術獨特而創新的特點是直觀的方式,其中基于圖像的搜索可通過數據庫內的文件來進行,而不必要求用戶建立一如本領域所要求的代表文件圖像。參見日本專利申請特開(Laid-Open)號9-237282,它對應于美國專利申請S.N.08/431,059,名稱為“采用結構分析的圖像數據庫瀏覽和查詢(ImageDatabase Browsing and Query Using Texture Analysis)”。在圖2A所示的本專利技術一特定實施例中,采用OCR掃描將文件的原文部分從文件圖像中提取并使其處于數據庫中。該數據庫可駐留于計算機系統中的任何或多個存儲媒體內,如固定盤32或系統存儲器16。搜索過程從初始查詢步驟102開始,在該步驟中用戶通過輸入裝置,如終端鍵盤30和顯示屏24,將一個或多個關鍵詞(即文本串或文本串組合)輸入系統。在基于文本的搜索步驟104進行對包含在數據庫內的文件文本部分進行的文本串的搜索。如果基于文本的搜索產生了感興趣的文件,則用戶可在步驟106停止任何進一步的步驟。否則,包含文本串本文檔來自技高網...
【技術保護點】
一種為特定文件圖像搜索包含多個文件圖像的數據庫的方法,每個文件圖像具有一文本分量、一壓縮表示和一非壓縮表示,所述方法包括以下步驟: 接收來自用戶的作為搜索關鍵詞的文本; 對所述文件圖像的文本分量進行搜索以尋找所述關鍵詞; 將具有包含所述關鍵詞的文本分量的文件圖像組合成基于文件圖像的壓縮表示或非壓縮表示處理的多個文件圖像群; 根據所述處理而顯示文件圖像的多個群中的每個的一代表文件圖像;以及 接受來自用戶的顯示一特定文件圖像群的輸入。
【技術特征摘要】
...
【專利技術屬性】
技術研發人員:約翰F卡倫,喬納森J赫爾,
申請(專利權)人:株式會社理光,
類型:發明
國別省市:JP[日本]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。