本發(fā)明專利技術(shù)公開了一種諺文數(shù)據(jù)庫、構(gòu)建方法及諺文數(shù)據(jù)庫檢索系統(tǒng),諺文數(shù)據(jù)庫的建立方法包括步驟:S1、按照諺文類別構(gòu)建數(shù)據(jù)表,具體包括書庫數(shù)據(jù)表、卷次庫數(shù)據(jù)表、句子庫數(shù)據(jù)表、被釋詞庫數(shù)據(jù)表、左音音庫數(shù)據(jù)表、右音音庫數(shù)據(jù)表、字庫數(shù)據(jù)表、單字庫數(shù)據(jù)表;S2、根據(jù)各類別諺文的屬性在相應(yīng)數(shù)據(jù)表中設(shè)置諺文屬性字段,并選取字段為數(shù)據(jù)表之間建立索引;S3、將諺文源文檔轉(zhuǎn)換為諺文電子數(shù)據(jù);S4、將諺文電子數(shù)據(jù)按照類別分別導(dǎo)入相應(yīng)的數(shù)據(jù)表中,由此生成諺文數(shù)據(jù)庫。實施本發(fā)明專利技術(shù)可檢索到諺文電子數(shù)據(jù)中句子、漢字、諺文注音、諺文注釋、音韻地位、聲調(diào)標(biāo)點等詳細信息,進而利用這些成果對近代漢語或韓語的語音系統(tǒng)進行歷時和共時的分析和討論。
【技術(shù)實現(xiàn)步驟摘要】
一種諺文數(shù)據(jù)庫、構(gòu)建方法及諺文數(shù)據(jù)庫檢索系統(tǒng)
本專利技術(shù)屬于漢語及韓語資訊處理
,更具體地,涉及一種謗文數(shù)據(jù)庫、構(gòu)建 方法及謗文數(shù)據(jù)庫檢索系統(tǒng)。
技術(shù)介紹
韓字是由朝鮮王朝第四代君主世宗大王于1443年通過《訓(xùn)民正音》創(chuàng)制而成,用 韓字寫成的文章稱為“謗文”。在此之前,韓語只以口語形式存在,朝廷、文武兩班等統(tǒng)治階 級書寫使用漢字。為了方便本國人學(xué)習(xí)漢語,在朝鮮產(chǎn)生了用韓字對漢字注音和翻譯的各 種對音韻書、辭書及漢語教科書,如:《東國正韻》、《四聲通解》、《譯語類解》、《老乞大》、《樸 通事》等。這些對音文獻為研究同時代漢語語言系統(tǒng)及韓語語言系統(tǒng)提供了非常重要的資 料。目前,對音韻書、辭書及漢語教科書的研究主要是通過對紙本進行統(tǒng)計查閱。由 于上述書目前后跨越近三百年,其中的句子、漢字、謗文注音、聲調(diào)標(biāo)點及謗文注釋均隨當(dāng) 時漢語的變化而發(fā)生變化,很難進行全面系統(tǒng)的比較研究。因此開發(fā)一套能夠涵蓋句子、 漢字、謗文注音、聲調(diào)標(biāo)點、謗文注釋的謗文數(shù)據(jù)庫及使用該數(shù)據(jù)庫進行謗文檢索的檢索系 統(tǒng),可為綜合研究16世紀(jì)-18世紀(jì)近代漢語的語音、聲調(diào)、詞匯、語法乃至同時代韓語的發(fā) 展變化提供一種方便、快捷、有效的工具。
技術(shù)實現(xiàn)思路
針對現(xiàn)有技術(shù)的以上缺陷或改進需求,本專利技術(shù)提供了一種謗文數(shù)據(jù)庫、構(gòu)建方法 及謗文數(shù)據(jù)庫檢索系統(tǒng),其目的在于將謗文源文檔轉(zhuǎn)化為可進行文本查找的謗文電子數(shù) 據(jù),使得用戶可以檢索到謗文電子數(shù)據(jù)中句子、漢字、謗文注音、謗文注釋、音韻地位、聲調(diào) 標(biāo)點等詳細信息,利用這些成果對近代漢語或韓語的語音系統(tǒng)進行歷時和共時的分析和討 論,由此解決目前難以對謗文音韻書、辭書及漢語教科書進行全面系統(tǒng)研究的技術(shù)問題。本專利技術(shù)解決其技術(shù)問題所采用的技術(shù)方案是,提供一種建立謗文數(shù)據(jù)庫的方法, 所述方法包括以下步驟:S1、按照謗文類別構(gòu)建數(shù)據(jù)表,具體包括書庫數(shù)據(jù)表、卷次庫數(shù)據(jù)表、句子庫數(shù)據(jù) 表、被釋詞庫數(shù)據(jù)表、左音音庫數(shù)據(jù)表、右音音庫數(shù)據(jù)表、字庫數(shù)據(jù)表、單字庫數(shù)據(jù)表;S2、根據(jù)各類別謗文的屬性在相應(yīng)數(shù)據(jù)表中設(shè)置謗文屬性字段,并選取字段為數(shù) 據(jù)表之間建立索引;S3、將謗文源文檔轉(zhuǎn)換為謗文電子數(shù)據(jù);S4、將所述謗文電子數(shù)據(jù)按照類別分別導(dǎo)入相應(yīng)的數(shù)據(jù)表中,由此生成謗文數(shù)據(jù)庫。在本專利技術(shù)所述的建立謗文數(shù)據(jù)庫的方法中,所述數(shù)據(jù)庫數(shù)據(jù)表包含所述謗文電子 數(shù)據(jù)的書名號、書名、作者、成書年代、所據(jù)底本、收錄源字段信息,所述卷次庫數(shù)據(jù)表包含 所述謗文電子數(shù)據(jù)的卷號、書名號、卷次字段信息,所述句子庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的句號、卷號、頁碼、正文帶頁碼及顏色標(biāo)記、正文、中文句子、謗文注釋、句子備注字段信 息,所述被釋詞庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的被釋詞號、句號、漢字號、被釋詞號、漢字備注、謗文左音、謗文左音備注、謗文左點、謗文左點備注、謗文左 音標(biāo)號、謗文右音、謗文右音備注、謗文右點、謗文右點備注、謗文右音標(biāo)號、漢字左點、漢字 左點備注、漢字右點、漢字右點備注字段信息,所述左音音庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù) 的左首標(biāo)號、謗文左首、謗文左首轉(zhuǎn)與、左首聲母、左首韻母、左首尾首字段彳目息,所述右首 音庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的右音標(biāo)號、謗文右音、謗文右音轉(zhuǎn)寫、右音聲母、右音 韻母、右音尾音字段信息,所述字庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的漢字號、字Unicode、被 釋漢字字段信息,所述單字庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的單字號、字Unicode、字字段 信息,所述音韻地位庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的字Unicode、字音號、字、音書、反切 上字、反切下字、攝、韻、呼、等、調(diào)、紐字段信息。在本專利技術(shù)所述的建立謗文數(shù)據(jù)庫的方法中,所述書庫數(shù)據(jù)表與所述卷次庫數(shù)據(jù)表 之間通過“書名號”建立索引;所述卷次庫數(shù)據(jù)表與所述句子庫數(shù)據(jù)表之間通過“卷號”建 立索引;所述句子庫數(shù)據(jù)表與所述被釋詞庫數(shù)據(jù)表之間通過“句號”建立索引;所述被釋詞 庫數(shù)據(jù)表與所述左音音庫數(shù)據(jù)表之間通過“謗文左音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表 與所述右音音庫數(shù)據(jù)表之間通過“謗文右音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表與所述字 庫數(shù)據(jù)表之間通過“漢字號”建立索引;所述字庫數(shù)據(jù)表與所述單字庫數(shù)據(jù)表之間通過“字 Unicode”建立索引;所述單字庫數(shù)據(jù)表與所述音韻地位庫數(shù)據(jù)表之間通過“字Unicode”建 立索引。相應(yīng)地,本專利技術(shù)還提供一種由所述建立謗文數(shù)據(jù)庫的方法構(gòu)建的謗文數(shù)據(jù)庫。相應(yīng)地,本專利技術(shù)還提供一種謗文數(shù)據(jù)庫檢索系統(tǒng),所述系統(tǒng)包括:輸入模塊,用于輸入檢索命令;與所述輸入模塊相連的檢索模塊,用于接受所述檢索命令并根據(jù)所述檢索命令進 行檢索以獲取謗文數(shù)據(jù)庫中的謗文電子數(shù)據(jù)信息,并控制輸出模塊輸出查詢檢索結(jié)果;與所述檢索模塊相連的,用于存儲謗文電子數(shù)據(jù)的謗文數(shù)據(jù)庫,所述謗文數(shù)據(jù)庫 由按照謗文類別構(gòu)建的數(shù)據(jù)表生成,具體包括書庫數(shù)據(jù)表、卷次庫數(shù)據(jù)表、句子庫數(shù)據(jù)表、 被釋詞庫數(shù)據(jù)表、左音音庫數(shù)據(jù)表、右音音庫數(shù)據(jù)表、字庫數(shù)據(jù)表、單字庫數(shù)據(jù)表,根據(jù)各類 別謗文的屬性在相應(yīng)數(shù)據(jù)表中設(shè)置謗文屬性字段,并選取字段為數(shù)據(jù)表之間建立索引;與所述檢索模塊相連的,用于輸出檢索結(jié)果的輸出模塊。在本專利技術(shù)所述的謗文數(shù)據(jù)庫檢索系統(tǒng)中,所述系統(tǒng)還包括與所述謗文數(shù)據(jù)庫相連 的用于將謗文源文檔轉(zhuǎn)換為所述謗文電子數(shù)據(jù)的數(shù)據(jù)轉(zhuǎn)換模塊,與所述數(shù)據(jù)轉(zhuǎn)換模塊相連 的用于在所述謗文源文檔發(fā)生變化時更新所述謗文數(shù)據(jù)庫中的謗文電子數(shù)據(jù)的數(shù)據(jù)更新 模塊。在本專利技術(shù)所述的謗文數(shù)據(jù)庫檢索系統(tǒng)中,所述書庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù) 的書名號、書名、作者、成書年代、所據(jù)底本、收錄源字段信息,所述卷次庫數(shù)據(jù)表包含所述 謗文電子數(shù)據(jù)的卷號、書名號、卷次字段信息,所述句子庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的 句號、卷號、頁碼、正文帶頁碼及顏色標(biāo)記、正文、中文句子、謗文注釋、句子備注字段信息, 所述被釋詞庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的被釋詞號、句號、漢字號、被釋詞號、漢字備 注、謗文左音、謗文左音備注、謗文左點、謗文左點備注、謗文左音標(biāo)號、謗文右音、謗文右音備注、謗文右點、謗文右點備注、謗文右音標(biāo)號、漢字左點、漢字左點備注、漢字右點、漢字右 點備注字段信息,所述左音音庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的左音標(biāo)號、謗文左音、謗文 左音轉(zhuǎn)寫、左音聲母、左音韻母、左音尾音字段信息,所述右音音庫數(shù)據(jù)表包含所述謗文電 子數(shù)據(jù)的右音標(biāo)號、謗文右音、謗文右音轉(zhuǎn)寫、右音聲母、右音韻母、右音尾音字段信息,所 述字庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的漢字號、字Unicode、被釋漢字字段信息,所述單字 庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的單字號、字Unicode、字字段信息,所述音韻地位庫數(shù)據(jù) 表包含所述謗文電子數(shù)據(jù)的字Unicode、字音號、字、音書、反切上字、反切下字、攝、韻、呼、 等、調(diào)、紐字段信息。在本專利技術(shù)所述的謗文數(shù)據(jù)庫檢索系統(tǒng)中,所述書庫數(shù)據(jù)表與所述卷次庫數(shù)據(jù)表之 間通過“書名號”建立索引;所述卷次庫數(shù)據(jù)表與所述句子庫數(shù)據(jù)表之間通過“卷號”建立 索引;所述句子庫數(shù)據(jù)表與所述被釋詞庫數(shù)據(jù)表之間通過“句號”建立索引;所述被釋詞庫 數(shù)據(jù)表與所述左音音庫數(shù)據(jù)表之間通過“謗文左音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表與 所述右音音庫數(shù)據(jù)表之間通過“謗文右音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表與本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種建立諺文數(shù)據(jù)庫的方法,其特征在于,所述方法包括以下步驟:S1、按照諺文類別構(gòu)建數(shù)據(jù)表,具體包括書庫數(shù)據(jù)表、卷次庫數(shù)據(jù)表、句子庫數(shù)據(jù)表、被釋詞庫數(shù)據(jù)表、左音音庫數(shù)據(jù)表、右音音庫數(shù)據(jù)表、字庫數(shù)據(jù)表、單字庫數(shù)據(jù)表;S2、根據(jù)各類別諺文的屬性在相應(yīng)數(shù)據(jù)表中設(shè)置諺文屬性字段,并選取字段為數(shù)據(jù)表之間建立索引;S3、將諺文源文檔轉(zhuǎn)換為諺文電子數(shù)據(jù);S4、將所述諺文電子數(shù)據(jù)按照類別分別導(dǎo)入相應(yīng)的數(shù)據(jù)表中,由此生成諺文數(shù)據(jù)庫。
【技術(shù)特征摘要】
1.一種建立謗文數(shù)據(jù)庫的方法,其特征在于,所述方法包括以下步驟:51、按照謗文類別構(gòu)建數(shù)據(jù)表,具體包括書庫數(shù)據(jù)表、卷次庫數(shù)據(jù)表、句子庫數(shù)據(jù)表、被釋詞庫數(shù)據(jù)表、左音音庫數(shù)據(jù)表、右音音庫數(shù)據(jù)表、字庫數(shù)據(jù)表、單字庫數(shù)據(jù)表;52、根據(jù)各類別謗文的屬性在相應(yīng)數(shù)據(jù)表中設(shè)置謗文屬性字段,并選取字段為數(shù)據(jù)表之間建立索引;53、將謗文源文檔轉(zhuǎn)換為謗文電子數(shù)據(jù);54、將所述謗文電子數(shù)據(jù)按照類別分別導(dǎo)入相應(yīng)的數(shù)據(jù)表中,由此生成謗文數(shù)據(jù)庫。2.如權(quán)利要求1所述的建立謗文數(shù)據(jù)庫的方法,其特征在于,所述書庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的書名號、書名、作者、成書年代、所據(jù)底本、收錄源字段信息,所述卷次庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的卷號、書名號、卷次字段信息,所述句子庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的句號、卷號、頁碼、正文帶頁碼及顏色標(biāo)記、正文、中文句子、謗文注釋、句子備注字段信息,所述被釋詞庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的被釋詞號、句號、漢字號、被釋詞號、漢字備注、謗文左音、謗文左音備注、謗文左點、謗文左點備注、謗文左音標(biāo)號、謗文右音、謗文右音備注、謗文右點、謗文右點備注、謗文右音標(biāo)號、漢字左點、漢字左點備注、漢字右點、漢字右點備注字段信息,所述左音音庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的左音標(biāo)號、 謗文左音、謗文左音轉(zhuǎn)寫、左音聲母、左音韻母、左音尾音字段信息,所述右音音庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的右音標(biāo)號、謗文右音、謗文右音轉(zhuǎn)寫、右音聲母、右音韻母、右音尾音字段信息,所述字庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的漢字號、字Unicode、被釋漢字字段信息,所述單字庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的單字號、字Unicode、字字段信息,所述音韻地位庫數(shù)據(jù)表包含所述謗文電子數(shù)據(jù)的字Unicode、字音號、字、音書、上字、反切下字、攝、 韻、呼、等、調(diào)、紐字段息。3.如權(quán)利要求2所述的建立謗文數(shù)據(jù)庫的方法,其特征在于,所述書庫數(shù)據(jù)表與所述卷次庫數(shù)據(jù)表之間通過“書名號”建立索引;所述卷次庫數(shù)據(jù)表與所述句子庫數(shù)據(jù)表之間通過“卷號”建立索引;所述句子庫數(shù)據(jù)表與所述被釋詞庫數(shù)據(jù)表之間通過“句號”建立索引; 所述被釋詞庫數(shù)據(jù)表與所述左音音庫數(shù)據(jù)表之間通過“謗文左音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表與所述右音音庫數(shù)據(jù)表之間通過“謗文右音標(biāo)號”建立索引;所述被釋詞庫數(shù)據(jù)表與所述字庫數(shù)據(jù)表之間通過“漢字號”建立索引;所述字庫數(shù)據(jù)表與所述單字庫數(shù)據(jù)表之間通過“字Unicode”建立索引;所述單字庫數(shù)據(jù)表與所述音韻地位庫數(shù)據(jù)表之間通過“字 Unicode”建立索引。4.一種由如權(quán)利要求1-3任一項所述的方法構(gòu)建的謗文數(shù)據(jù)庫。5.一種謗文數(shù)據(jù)庫檢索系統(tǒng),其特征在于,所述系統(tǒng)包括:輸入模塊,用于輸入檢索命令;與所述輸入模塊相連的檢索模塊,用于接受所述檢索命令并根據(jù)所述檢索命令進行檢索以...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:朱煒,尉遲治平,高天俊,尉遲明,
申請(專利權(quán))人:華中科技大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。