• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    文件解析方法及裝置制造方法及圖紙

    技術(shù)編號(hào):15690979 閱讀:215 留言:0更新日期:2017-06-24 03:48
    本發(fā)明專利技術(shù)適用于數(shù)據(jù)解析技術(shù)領(lǐng)域,提供了一種文件解析方法及裝置,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。本發(fā)明專利技術(shù)可以快速對(duì)文件進(jìn)行解析,保證解析的高效性,并且具有高容錯(cuò)性,能夠處理不規(guī)范的數(shù)據(jù)。

    File parsing method and apparatus

    The invention is applicable to the technical field of data analysis, and provides a device for document analytic method, the analyzing method comprises the following steps: pre configured in different field analytical condition to read the file parsing strategy execution corresponding to the preset special characters; read the file to be analyzed in the data acquisition, analysis of the current state of the field; from the the pre configured different field analytical condition to read the corresponding file parsing strategy execution to find file parsing strategies match field analytical state of the current default after using special characters; and the file parsing strategy when the field analytical state before matching the implementation of the corresponding process file parsing. The invention can parse files quickly, guarantee the efficiency of parsing, and has high fault tolerance and can handle nonstandard data.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    文件解析方法及裝置
    本專利技術(shù)屬于數(shù)據(jù)解析
    ,尤其涉及文件解析方法及裝置。
    技術(shù)介紹
    現(xiàn)今,不同文本的格式規(guī)范各不相同,常見的CSV解析方法嚴(yán)重依賴與CSV文件的格式規(guī)范,即只能處理常規(guī)CSV文件,當(dāng)CSV文件稍有不規(guī)范的地方,就會(huì)導(dǎo)致整個(gè)文件解析失敗,容錯(cuò)性低,而為了提高容錯(cuò)性,會(huì)對(duì)一行數(shù)據(jù)進(jìn)行多次掃描分析,降低解析效率。因此,現(xiàn)有技術(shù)中存在著解析文件時(shí)無法處理不規(guī)范數(shù)據(jù),容錯(cuò)性低,且解析效率低的問題。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)實(shí)施例提供一種文件解析方法及裝置,旨在解決現(xiàn)有技術(shù)中解析文件時(shí)無法處理不規(guī)范數(shù)據(jù),容錯(cuò)性低,且解析效率低的問題。第一方面,本專利技術(shù)實(shí)施例提供了一種文件解析方法,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。第二方面,本專利技術(shù)實(shí)施例提供了一種文件解析裝置,所述解析裝置包括:配置模塊,用于預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;獲取模塊,用于讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);查找模塊,用于從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;執(zhí)行模塊,用于利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。本專利技術(shù)實(shí)施例與現(xiàn)有技術(shù)相比存在的有益效果是:本專利技術(shù)實(shí)施例通過預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程,從而可以快速對(duì)文件進(jìn)行解析,保證解析的高效性,并且具有高容錯(cuò)性,能夠處理不規(guī)范的數(shù)據(jù)。附圖說明圖1為本專利技術(shù)實(shí)施例提供的一種文件解析方法的流程示意圖;圖2為圖1所示實(shí)施例中的步驟S104的細(xì)化步驟流程示意圖;圖3為圖2所示實(shí)施例中的步驟S204的細(xì)化步驟流程示意圖;圖4為圖2所示實(shí)施例中的步驟S204的另一細(xì)化步驟流程示意圖;圖5為圖1所示實(shí)施例中的步驟S104的另一細(xì)化步驟流程示意圖;圖6為本專利技術(shù)實(shí)施例提供的一種文件解析裝置的結(jié)構(gòu)示意圖;圖7為圖6所示實(shí)施例中的執(zhí)行模塊604的細(xì)化結(jié)構(gòu)示意圖。具體實(shí)施方式為了使本專利技術(shù)的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本專利技術(shù)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本專利技術(shù),并不用于限定本專利技術(shù)。為了使本專利技術(shù)的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本專利技術(shù)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本專利技術(shù),并不用于限定本專利技術(shù)。為了說明本專利技術(shù)所述的技術(shù)方案,下面通過具體實(shí)施例來進(jìn)行說明。請(qǐng)參閱圖1,圖1為本專利技術(shù)實(shí)施例提供的一種文件解析方法的流程示意圖。本實(shí)施例的執(zhí)行主體為解析裝置。本實(shí)施例提供的文件解析方法包括以下步驟:步驟S101、預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略。在本專利技術(shù)實(shí)施例中,預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略,并將該文件解析策略保存于解析裝置中。其中,文件解析策略為對(duì)待解析文件中的數(shù)據(jù)進(jìn)行讀取、容錯(cuò)處理、保存等處理,并對(duì)字段解析狀態(tài)進(jìn)行狀態(tài)轉(zhuǎn)變的文件解析策略。步驟S102、讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài)。在本專利技術(shù)實(shí)施例中,解析裝置在執(zhí)行文件解析的過程中,自動(dòng)獲取當(dāng)前處于何種文件解析狀態(tài),在文件解析狀態(tài)下讀取到預(yù)設(shè)特殊字符之后,根據(jù)文件解析狀態(tài)所對(duì)應(yīng)的文件解析策略解析待解析的文件。步驟S103、從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略。在本專利技術(shù)實(shí)施例中,在某個(gè)字段解析狀態(tài)下,若解析裝置讀取到某個(gè)預(yù)設(shè)特殊字符,則從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與上述某個(gè)字段解析狀態(tài)相匹配的文件解析策略。步驟S104、利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。在本專利技術(shù)實(shí)施例中,在某個(gè)字段解析狀態(tài)下,解析裝置利用與該字段解析狀態(tài)相匹配的文件解析策略對(duì)待解析文件中的數(shù)據(jù)進(jìn)行讀取、容錯(cuò)處理、保存等處理,以及將該字段解析狀態(tài)轉(zhuǎn)變成其他字段解析狀態(tài)。進(jìn)一步地,圖2示出了步驟S104中利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程的具體實(shí)現(xiàn)流程,詳述如下:步驟S201、當(dāng)當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符為字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,并判斷該字符是否為字段包括符,若是字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài)。若不是字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。步驟S202、當(dāng)當(dāng)前的字段解析狀態(tài)為字段開始狀態(tài)時(shí),若接下來讀取到的字符不是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為字段開始狀態(tài)時(shí),若接下來讀取到的字符是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。若接下來讀取到的字符不是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。步驟S203、當(dāng)當(dāng)前的字段解析狀態(tài)為字段匹配狀態(tài)時(shí),根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略讀取待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為字段匹配狀態(tài)時(shí),根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略讀取待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。若讀取到當(dāng)前字符不為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略繼續(xù)讀取待解析文件中的數(shù)據(jù),且不轉(zhuǎn)變當(dāng)前的字段解析狀態(tài)。步驟S204、當(dāng)當(dāng)前的字段解析狀態(tài)為字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符不是字段分隔符或行結(jié)束符,則根據(jù)與字段結(jié)束狀態(tài)相匹配的文件解析策略對(duì)當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理。進(jìn)一步地,圖3示出了步驟S204中當(dāng)當(dāng)前的字段解析狀態(tài)為字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符不是本文檔來自技高網(wǎng)...
    文件解析方法及裝置

    【技術(shù)保護(hù)點(diǎn)】
    一種文件解析方法,其特征在于,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。

    【技術(shù)特征摘要】
    1.一種文件解析方法,其特征在于,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。2.如權(quán)利要求1所述的解析方法,其特征在于,所述利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符為字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段開始狀態(tài)時(shí),若接下來讀取到的字符不是所述字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段匹配狀態(tài)時(shí),根據(jù)與所述字段匹配狀態(tài)相匹配的文件解析策略讀取所述待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為所述字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理。3.如權(quán)利要求2所述的解析方法,其特征在于,所述當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取所述下一個(gè)字符,若所述下一個(gè)字符為所述字段包括符,檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若有所述出錯(cuò)標(biāo)簽,則關(guān)閉容錯(cuò)標(biāo)記功能,結(jié)束容錯(cuò)處理;若沒有所述出錯(cuò)標(biāo)簽,則打開所述容錯(cuò)標(biāo)記功能,在文件解析出錯(cuò)的地方設(shè)置出錯(cuò)標(biāo)簽,且所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段匹配狀態(tài)。4.如權(quán)利要求2所述的解析方法,其特征在于,所述當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理還包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取所述下一個(gè)字符,若所述下一個(gè)字符為轉(zhuǎn)義字符或普通字符,則檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若有所述出錯(cuò)標(biāo)簽,則延長(zhǎng)所述出錯(cuò)標(biāo)簽的標(biāo)志范圍;若沒有所述出錯(cuò)標(biāo)簽,則打開容錯(cuò)標(biāo)記功能,在文件解析出錯(cuò)的地方設(shè)置所述出錯(cuò)標(biāo)簽,且所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段匹配狀態(tài)。5.如權(quán)利要求2所述的解析方法,其特征在于,所述解析方法還包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),若所述下一個(gè)字符為所述字段分隔符或所述行結(jié)束符,檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若沒有所述出錯(cuò)標(biāo)簽,則所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段分割狀態(tài)或所述行結(jié)束狀態(tài);若有所述出錯(cuò)標(biāo)簽,則檢測(cè)容錯(cuò)標(biāo)記功能是否打開;若打開,則延長(zhǎng)所述出錯(cuò)標(biāo)簽的標(biāo)志范圍;若沒有打開,則所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:陳曉攀,熊志強(qiáng),胡偉梁嘉,
    申請(qǐng)(專利權(quán))人:深圳市漢云科技有限公司,
    類型:發(fā)明
    國(guó)別省市:廣東,44

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码无卡在线播放| 成人免费无遮挡无码黄漫视频| 亚洲性无码AV中文字幕| 中文无码字慕在线观看| 成年男人裸j照无遮挡无码| 免费a级毛片无码a∨性按摩| 国产丝袜无码一区二区三区视频| 亚洲中文字幕无码一去台湾| 无码的免费不卡毛片视频| 久久水蜜桃亚洲av无码精品麻豆| 久久无码中文字幕东京热| 中文字幕无码精品亚洲资源网 | 久久无码人妻一区二区三区| 无码不卡中文字幕av| 久久精品国产亚洲AV无码偷窥| 最新亚洲人成无码网站| 99久久人妻无码精品系列蜜桃| 中文字幕丰满伦子无码 | av中文无码乱人伦在线观看| 无码人妻精品一区二区三区在线| 亚洲一区无码精品色| 无码国产精品一区二区免费I6| 亚洲AV无码AV男人的天堂| 久久久精品人妻无码专区不卡| 久久人妻无码一区二区| 特级小箩利无码毛片| 中文字幕无码高清晰| 亚洲日韩精品无码专区加勒比| 无码精品日韩中文字幕| 亚洲V无码一区二区三区四区观看 亚洲爆乳精品无码一区二区三区 亚洲爆乳无码一区二区三区 | 无码毛片内射白浆视频| 无码人妻精品一区二区三区蜜桃| 亚洲韩国精品无码一区二区三区| 中文字幕无码视频专区| 亚洲中文字幕无码永久在线| 国内精品人妻无码久久久影院| 中文字幕日韩精品无码内射| 亚洲精品无码激情AV| 成人无码AV一区二区| 国产成年无码久久久久毛片| 亚洲AV无码一区二区二三区入口|