本發明專利技術是一種使用可擴展標記語言(簡稱為XML)表示電子字典數據的方法,其通過產生更具結構性、標準性及可讀性的XML文件作為中間過渡的數據文件,可以克服出版商提供的原始數據和應用到電子字典硬件上的二進制數據之間差別太大的問題,且由于統一的規范定義了不同的原始數據的方式,當修改了二進制數據后,只要修改負責從XML文件生成二進制數據的轉換程序即可,大大降低測試難度及工作量。
【技術實現步驟摘要】
本專利技術涉及的是一種表示電子字典數據的方法,更確切地說是涉及一種使用可擴展標記語言(eXtensible?Markup?Language,簡稱為XML)表示電子字典數據的方法。
技術介紹
隨著數字化時代的來臨,學習也逐漸走向電子化、信息化,電子字典或詞典(electronic?dictionary)的普及,大大減少了人們學習時煩瑣的查閱數據的時間。除了電子字典機,目前手機、個人數字助理(PDA)、MP3或MP4等產品紛紛加入了電子字典功能。對于開發者而言,處理電子字典數據的做法通常是針對出版商所提供不同格式的原始數據,通過相應的程序來生成最終應用到硬件上的二進制數據。當這些二進制數據的格式被修改后,原先用來生成這些二進制數據的程序都必須做相應的修改。而使用二進制數據調試、查找錯誤及修正都會比較麻煩而容易出錯,尤其面對電子字典越來越龐大的數據量,更是使得測試工作相加繁重。為了解決出版商所提供的原始數據和應用到硬件上的二進制數據之間差別太大的問題,建立一種中間過渡的數據文件是非常必要的。
技術實現思路
本專利技術的目的就是在提供一種使用可擴展標記語言(XML)表示電子字典數據的方法,用以克服上述缺陷。本專利技術提出一種使用XML表示電子字典數據的方法,其首先將各種原始數據通過相應的處理程序,以生成相應的可擴展標記語言(XML)文件,所述的原始數據是由各出版商提供以應用在電子字典的文本數據;接著將所述的XML文件通過一個轉程序,以生成相應的二進制數據,所述的二進制數據用來應用到電子字典硬件上。其中,所述的XML文件的生成規則包括:(1)所述的可擴展標記語言文件定義了一個根節點,這個根節點其下包括一-->個格式信息節點、至少一個紀錄節點及一些根節點屬性,所述的根節點屬性可用來提供這個根節點的基本信息;(2)所述的格式信息節點定義了電子字典數據統一的排版信息,其包括至少一格式類型節點,且所述的格式類型節點包括類型屬性及排版方式屬性,其中類型屬性內容為所欲統一排版的對象,排版方式屬性的內容規范排版方式;以及(3)所述的紀錄節點用來包含電子字典數據中每一個詞條的可見內容和用于程序處理的檢索信息及其它標志信息,所述的紀錄節點其下包含一個標題節點、至少一個顯示頁節點和一些紀錄節點屬性;其中,(a)所述的紀錄節點屬性內容記載了紀錄節點所對應的詞條的唯一辨識碼,它標識了詞條在整個電子字典數據中的位置;(b)所述的標題節點其下包括一個檢索輸入方式節點、至少一個檢索結果顯示節點和一個顯示段落節點,其中所述的檢索輸入方式節點包含了檢索用的方式及字符串,所述的檢索結果顯示節點則用于包含檢索時結果的顯示,而所述的顯示段落節點內容則是顯示時的標題段落,其下包括至少一個段落片段節點,每個段落片段節點內容則是顯示段落節點所對應的段落中某一片段內容,通過設定每個段落片段節點的屬性來表示每個片段內容的風格;以及(c)所述的顯示頁節點把除詞條除標題外的內容進行分解到所述的顯示頁節點其下所包括的段落片段節點,所述的顯示頁節點的顯示頁編號屬性確保即便是詞條中間位置的內容也可被容易的定位。本專利技術通過XML表示電子字典數據,產生更具結構性、標準性及可讀性的XML文件作為中間過渡的數據文件,可以克服出版商提供的原始數據和應用到電子字典硬件上的二進制數據之間差別太大的問題,且由于統一的規范定義了不同的原始數據顯示的方式,當修改了二進制數據后,只要修改負責從XML文件生成二進制數據的轉換程序即可,大大降低測試難度及工作量。附圖說明圖1為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法的流程圖;圖2為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法中生成的二進制數據的片段應用到電子字典硬件上的實際顯示畫面;-->圖3為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法中生成的XML文件的樹形結構圖;圖4為圖2所示的電子字典實際顯示畫面相應的二進制數據的片段。附圖標記說明:S11-將各種原始數據通過相應的處理程序以生成相應的XML文件;S12-將XML文件通過一個XML2BIN程序以生成相應的二進制數據。具體實施方式以下結合附圖,對本專利技術上述的和另外的技術特征和優點作更詳細的說明。圖1為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法的流程圖。請參照圖1,首先,在步驟S11,將各種原始數據通過相應的處理程序,以生成相應的XML文件。例如,原始數據A通過處理程序A以生成XML文件A,而原始數據B通過處理程序B以生成XML文件B。原始數據例如是英漢字典、漢英字典、英英字典、專業字典、生活美語、旅游會話等由各種出版商提供以應用在電子字典的文本數據。但是,不同出版商提供的原始數據的格式通常是不相同的,甚至于同一出版商提供的原始數據的格式也有可能是不相同的,因此必須依據原始數據的格式采用相應的處里程序以生成相應的XML文件。由于XML本身所具有的靈活性和結構性,使得利用一些測試程序校驗步驟S11所生成的XML文件變成是一件容易的事情,而且XML文件還可以使用一般的文本編輯器來查看和修改。接著,在步驟S12,將這些XML文件通過一個轉換程序(XML2BIN程序),以生成相應的二進制數據,這個二進制數據可應用到電子字典硬件上。例如,XML文件A通過XML2BIN程序以生成二進制數據A,而XML文件B通過XML2BIN程序以生成二進制數據B。圖2為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法中生成的二進制數據的片段應用到電子字典硬件上的實際顯示畫面。請參照圖2,這是一部英漢字典,畫面右半部顯示這部英漢字典某一詞條的可見內容(即印刷出來的內容),在本例中,其包括詞條的標題“anywhere”、詞性“adv”、第一個詞意“1任何地方renhe?defang.”、第二個詞意“2[習語]get?anywhere→GET.”等。某些詞條由于可見內容較多,需要兩個以上的顯示頁才能完整表示。圖3為依照本專利技術一實施例所繪示的使用XML表示電子字典數據的方法中生成的XML文件的樹形結構圖。請參照圖3,所述的XML文件將電子字典數-->據以XML格式表示,其定義了一個名為layout的根節點。由于這個根節點亦是一個XML的根元素(root?element),故根節點亦可稱為根元素、layout節點或layout元素,而所述的XML文件亦稱為layout?XML文件。這個根節點其下包括一個格式信息(format_info)節點、至少一個紀錄(record)節點及一些根節點屬性,其中所述的根節點屬性可用來提供這個根節點的基本信息,如擁有者、字典種類、字典版本等。在layout?XML文件中,根節點屬性是以元素的屬性(attribute)方式表現,format_info節點和record節點是以元素(element)方式表現,故format_info節點亦可稱為format_info元素,而record節點亦可稱為record元素,其它可依此類推。format_info節點定義了電子字典數據統一的排版信息,如縮進方式、對齊方式或對齊位置等。例如以圖2所示詞條畫面為例,其format_info節點如下:??<format_info>????本文檔來自技高網...
【技術保護點】
一種使用可擴展標記語言表示電子字典數據的方法,其特征在于,其包括: 將各種原始數據通過相應的處理程序,以生成相應的可擴展標記語言文件,所述的原始數據是由各出版商提供以應用在電子字典的文本數據;以及 將這些可擴展標記語言文件通過一個轉換程序,以生成相應的二進制數據,所述的二進制數據用來應用到電子字典硬件上;其中,所述的可擴展標記語言文件的生成規則包括: (1)所述的可擴展標記語言文件定義了一個根節點,這個根節點其下包括一個格式信息節點、至少一個紀錄節點及一些根節點屬性,所述的根節點屬性可用來提供這個根節點的基本信息; (2)所述的格式信息節點定義了電子字典數據統一的排版信息,其包括至少一格式類型節點,且所述的格式類型節點包括類型屬性及排版方式屬性,其中類型屬性內容為所欲統一排版的對象,排版方式屬性的內容規范排版方式;以及 (3)所述的紀錄節點用來包含電子字典數據中每一個詞條的可見內容和用于程序處理的檢索信息及其它標志信息,所述的紀錄節點其下包含一個標題節點、至少一個顯示頁節點和一些紀錄節點屬性;其中, (a)所述的紀錄節點屬性內容記載了紀錄節點所對應的詞條的唯一辨識碼,它標識了詞條在整個電子字典數據中的位置; (b)所述的標題節點其下包括一個檢索輸入方式節點、至少一個檢索結果顯示節點和一個顯示段落節點,其中所述的檢索輸入方式節點包含了檢索用的方式及字符串,所述的檢索結果顯示節點則用于包含檢索時結果的顯示,而所述的顯示段落節點內容則是顯示時的標題段落,其下包括至少一個段落片段節點,每個段落片段節點內容則是顯示段落節點所對應的段落中某一片段內容,通過設定每個段落片段節點的屬性來表示每個片段內容的風格;以及 (c)所述的顯示頁節點把除詞條除標題外的內容進行分解到所述的顯示頁節點其下所包括的段落片段節點,所述的顯示頁節點的顯示頁編號屬性確保即便是詞條中間位置的內容也可被容易的定位。...
【技術特征摘要】
1、一種使用可擴展標記語言表示電子字典數據的方法,其特征在于,其包括:將各種原始數據通過相應的處理程序,以生成相應的可擴展標記語言文件,所述的原始數據是由各出版商提供以應用在電子字典的文本數據;以及將這些可擴展標記語言文件通過一個轉換程序,以生成相應的二進制數據,所述的二進制數據用來應用到電子字典硬件上;其中,所述的可擴展標記語言文件的生成規則包括:(1)所述的可擴展標記語言文件定義了一個根節點,這個根節點其下包括一個格式信息節點、至少一個紀錄節點及一些根節點屬性,所述的根節點屬性可用來提供這個根節點的基本信息;(2)所述的格式信息節點定義了電子字典數據統一的排版信息,其包括至少一格式類型節點,且所述的格式類型節點包括類型屬性及排版方式屬性,其中類型屬性內容為所欲統一排版的對象,排版方式屬性的內容規范排版方式;以及(3)所述的紀錄節點用來包含電子字典數據中每一個詞條的可見內容和用于程序處理的檢索信息及其它標志信息,所述的紀錄節點其下包含一個標題節點、至少一個顯示頁節點和一些紀錄節點屬性;其中,(a)所述的紀錄節點屬性內容記載了紀錄節點所對應的詞條的唯一辨識碼,它標識了詞條在整個電子字典數據中的位置;(b)所述的標題節點其下包括一個檢索輸入方式節點、至少一個檢索結果顯示節點和一個顯示段落節點,其中所述的檢索輸入方式節點包含了檢索用的方式及字符串,所述的檢索結果顯示節點則用于包含檢索時結果的顯示,而所述的顯示段落節點內容則是顯示時的標題段落,其下包括至少一個...
【專利技術屬性】
技術研發人員:陸春勇,顧周怡,
申請(專利權)人:金寶電子中國有限公司,
類型:發明
國別省市:44[中國|廣東]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。