本發(fā)明專(zhuān)利技術(shù)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,提出了目標(biāo)數(shù)據(jù)抓取方法、系統(tǒng)、應(yīng)種漏種提醒方法及系統(tǒng),包括獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;所述Table標(biāo)簽具有多個(gè)元素;對(duì)任一Table標(biāo)簽,配置一map對(duì)象,根據(jù)用戶(hù)輸入的行值和列值,在Table標(biāo)簽中確定一塊第一目標(biāo)區(qū)域,將第一目標(biāo)區(qū)域的元素存入map對(duì)象;任一所述元素在map對(duì)象中的坐標(biāo)與其在Table標(biāo)簽中的坐標(biāo)相同;任一所述元素在map對(duì)象中的坐標(biāo)由key值和value值確定;根據(jù)用戶(hù)輸入的行值和列值,在所述map對(duì)象中確定一塊第二目標(biāo)區(qū)域,所述第二目標(biāo)區(qū)域的元素作為所述目標(biāo)數(shù)據(jù)。通過(guò)上述技術(shù)方案,解決了現(xiàn)有技術(shù)中數(shù)據(jù)在不同平臺(tái)之間轉(zhuǎn)移費(fèi)時(shí)費(fèi)力的問(wèn)題。在不同平臺(tái)之間轉(zhuǎn)移費(fèi)時(shí)費(fèi)力的問(wèn)題。在不同平臺(tái)之間轉(zhuǎn)移費(fèi)時(shí)費(fèi)力的問(wèn)題。
【技術(shù)實(shí)現(xiàn)步驟摘要】
目標(biāo)數(shù)據(jù)抓取方法、系統(tǒng)、應(yīng)種漏種提醒方法及系統(tǒng)
[0001]本專(zhuān)利技術(shù)涉及數(shù)據(jù)處理
,具體的,涉及目標(biāo)數(shù)據(jù)抓取方法、系統(tǒng)、應(yīng)種漏種提醒方法及系統(tǒng)。
技術(shù)介紹
[0002]疫苗接種是預(yù)防傳染病最經(jīng)濟(jì)最有效的手段,疫苗免疫程序的制定就是為了讓兒童通過(guò)接種疫苗,使自身產(chǎn)生抵御疾病的保護(hù)性抗體,從而保證兒童的健康成長(zhǎng)。現(xiàn)在兒童接種疫苗通常需要憑借疫苗接種本去醫(yī)院排隊(duì)打針,為避免由于不能及時(shí)的掌握疫苗接種時(shí)間,造成錯(cuò)過(guò)疫苗的最佳接種時(shí)間,影響兒童的生長(zhǎng)健康,醫(yī)院設(shè)置了應(yīng)種漏種提醒系統(tǒng),用于提醒應(yīng)種或漏種兒童及時(shí)接種。
[0003]為實(shí)現(xiàn)應(yīng)種漏種提醒功能,需要首先從免疫平臺(tái)下載兒童接種記錄,然后將接種記錄逐個(gè)輸入或復(fù)制到計(jì)算平臺(tái),計(jì)算平臺(tái)計(jì)算出應(yīng)種漏種兒童信息,最后向?qū)?yīng)的手機(jī)號(hào)碼發(fā)送提醒信息。由于數(shù)據(jù)量大,接種記錄從免疫平臺(tái)到計(jì)算平臺(tái)的轉(zhuǎn)移過(guò)程費(fèi)時(shí)費(fèi)力。
技術(shù)實(shí)現(xiàn)思路
[0004]本專(zhuān)利技術(shù)提出目標(biāo)數(shù)據(jù)抓取方法、系統(tǒng)、應(yīng)種漏種提醒方法及系統(tǒng),解決了相關(guān)技術(shù)中數(shù)據(jù)在不同平臺(tái)之間轉(zhuǎn)移費(fèi)時(shí)費(fèi)力的問(wèn)題。
[0005]本專(zhuān)利技術(shù)的技術(shù)方案如下:第一方面,目標(biāo)數(shù)據(jù)抓取方法,用于從至少一個(gè)業(yè)務(wù)平臺(tái)抓取目標(biāo)數(shù)據(jù),所述業(yè)務(wù)平臺(tái)包括多個(gè)頁(yè)面,包括:獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;所述Table標(biāo)簽具有多個(gè)元素,每個(gè)元素在所述Table標(biāo)簽中的坐標(biāo)由行標(biāo)簽和列標(biāo)簽確定;對(duì)任一Table標(biāo)簽,配置一map對(duì)象,根據(jù)用戶(hù)輸入的行值和列值,在Table標(biāo)簽中確定一塊第一目標(biāo)區(qū)域,將第一目標(biāo)區(qū)域的元素存入map對(duì)象;任一所述元素在map對(duì)象中的坐標(biāo)與其在Table標(biāo)簽中的坐標(biāo)相同;任一所述元素在map對(duì)象中的坐標(biāo)由key值和value值確定;根據(jù)用戶(hù)輸入的行值和列值,在所述map對(duì)象中確定一塊第二目標(biāo)區(qū)域,所述第二目標(biāo)區(qū)域的元素作為所述目標(biāo)數(shù)據(jù)。
[0006]第二方面,目標(biāo)數(shù)據(jù)抓取系統(tǒng),用于從至少一個(gè)業(yè)務(wù)平臺(tái)頁(yè)面抓取目標(biāo)數(shù)據(jù),所述業(yè)務(wù)平臺(tái)包括多個(gè)頁(yè)面,包括:第一獲取單元,用于獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;所述Table標(biāo)簽具有多個(gè)元素,每個(gè)元素在所述Table標(biāo)簽中的坐標(biāo)由行標(biāo)簽和列標(biāo)簽確定;第一處理單元,用于對(duì)任一Table標(biāo)簽,配置一map對(duì)象,根據(jù)用戶(hù)輸入的行值和列值,在Table標(biāo)簽中確定一塊第一目標(biāo)區(qū)域,將第一目標(biāo)區(qū)域的元素存入map對(duì)象;任一所述元素在map對(duì)象中的坐標(biāo)與其在Table標(biāo)簽中的坐標(biāo)相同;任一所述元素在map對(duì)象中的坐標(biāo)由key值和value值確定;
第二處理單元,用于根據(jù)用戶(hù)輸入的行值和列值,在所述map對(duì)象中確定一塊第二目標(biāo)區(qū)域,所述第二目標(biāo)區(qū)域的元素作為所述目標(biāo)數(shù)據(jù)。
[0007]第三方面,疫苗應(yīng)種漏種提醒方法,包括:從免疫平臺(tái)抓取接種記錄,所述接種記錄包括多條記錄,每條記錄包括一一對(duì)應(yīng)的疫苗與劑次、接種日期、接種者姓名、手機(jī)號(hào)碼;調(diào)用預(yù)設(shè)的接種規(guī)則,根據(jù)所述接種記錄,計(jì)算應(yīng)種漏種信息;任一條所述應(yīng)種漏種信息包括一一對(duì)應(yīng)的疫苗與劑次、預(yù)約接種日期、接種者姓名和手機(jī)號(hào)碼;根據(jù)所述應(yīng)種漏種信息,發(fā)送提醒信息到對(duì)應(yīng)的手機(jī)號(hào)碼。
[0008]第四方面,疫苗應(yīng)種漏種提醒系統(tǒng),包括:第二獲得單元,用于從免疫平臺(tái)抓取接種記錄,所述接種記錄包括多條記錄,每條記錄包括一一對(duì)應(yīng)的疫苗與劑次、接種日期、接種者姓名、手機(jī)號(hào)碼;計(jì)算單元,用于調(diào)用預(yù)設(shè)的接種規(guī)則,根據(jù)所述接種記錄,計(jì)算應(yīng)種漏種信息;任一條所述應(yīng)種漏種信息包括一一對(duì)應(yīng)的疫苗與劑次、預(yù)約接種日期、接種者姓名和手機(jī)號(hào)碼;發(fā)送單元,用于根據(jù)所述應(yīng)種漏種信息,發(fā)送提醒信息到對(duì)應(yīng)的手機(jī)號(hào)碼。
[0009]本專(zhuān)利技術(shù)的工作原理及有益效果為:從業(yè)務(wù)平臺(tái)獲取的html數(shù)據(jù)大部分是Table標(biāo)簽(表格數(shù)據(jù)),這里的table標(biāo)簽是一個(gè)完整的字符串,里面包含html各種語(yǔ)法標(biāo)識(shí),這些對(duì)于用戶(hù)來(lái)說(shuō)是無(wú)效數(shù)據(jù)。本專(zhuān)利技術(shù)通過(guò)建立Table標(biāo)簽與map對(duì)象的映射關(guān)系,能夠根據(jù)用戶(hù)配置的行值和列值,將Table標(biāo)簽中的特定元素存入map對(duì)象中,利用map對(duì)象具有行列式矩陣的特性,其中,map對(duì)象的key值對(duì)應(yīng)行列式矩陣的行值,map對(duì)象的value值對(duì)應(yīng)行列式矩陣的列值。因此,通過(guò)將Table標(biāo)簽中的特定元素存入map對(duì)象的對(duì)應(yīng)位置,可以通過(guò)用戶(hù)配置的行值和列值,對(duì)map對(duì)象中的元素進(jìn)行定位,從而實(shí)現(xiàn)目標(biāo)數(shù)據(jù)的有效讀取。
[0010]獲取的目標(biāo)數(shù)據(jù)可以先保存在本地,然后上傳至另一個(gè)業(yè)務(wù)平臺(tái),實(shí)現(xiàn)數(shù)據(jù)在不同業(yè)務(wù)平臺(tái)間的自動(dòng)轉(zhuǎn)移;也可以在另一個(gè)業(yè)務(wù)平臺(tái)創(chuàng)建接口程序,將獲取的目標(biāo)數(shù)據(jù)直接推送至另一個(gè)業(yè)務(wù)平臺(tái)。
[0011]本專(zhuān)利技術(shù)的目標(biāo)數(shù)據(jù)抓取方法實(shí)現(xiàn)了業(yè)務(wù)平臺(tái)上Table標(biāo)簽數(shù)據(jù)的有效獲取,便于數(shù)據(jù)在不同業(yè)務(wù)平臺(tái)間的自動(dòng)轉(zhuǎn)移,從而減輕了人工勞動(dòng)強(qiáng)度。
附圖說(shuō)明
[0012]下面結(jié)合附圖和具體實(shí)施方式對(duì)本專(zhuān)利技術(shù)作進(jìn)一步詳細(xì)的說(shuō)明。
[0013]圖1為本專(zhuān)利技術(shù)目標(biāo)數(shù)據(jù)抓取方法流程圖;圖2為本專(zhuān)利技術(shù)中table標(biāo)簽的一個(gè)示例代碼;圖3為本專(zhuān)利技術(shù)目標(biāo)數(shù)據(jù)抓取系統(tǒng)結(jié)構(gòu)示意圖;圖4為本專(zhuān)利技術(shù)疫苗應(yīng)種漏種提醒方法流程圖;圖5為本專(zhuān)利技術(shù)疫苗應(yīng)種漏種提醒系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施方式
[0014]下面將結(jié)合本專(zhuān)利技術(shù)實(shí)施例,對(duì)本專(zhuān)利技術(shù)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,
顯然,所描述的實(shí)施例僅僅是本專(zhuān)利技術(shù)一部分實(shí)施例,而不是全部的實(shí)施例。基于本專(zhuān)利技術(shù)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都涉及本專(zhuān)利技術(shù)保護(hù)的范圍。
[0015]實(shí)施例一如圖1所示,為本實(shí)施例目標(biāo)數(shù)據(jù)抓取方法流程圖,包括:S100:獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;上述Table標(biāo)簽具有多個(gè)元素,每個(gè)元素在上述Table標(biāo)簽中的坐標(biāo)由行標(biāo)簽和列標(biāo)簽確定;如圖2所示,html數(shù)據(jù)中的table標(biāo)簽是一個(gè)完整的字符串,里面包含html各種語(yǔ)法標(biāo)識(shí),每個(gè)元素的定位通過(guò)XPath語(yǔ)法實(shí)現(xiàn)。例如,標(biāo)簽table1的第5行、第1列的元素,可以通過(guò)下面的代碼表示:/html/body//table1/tbody/tr[5]/td[1]其中,/tr[]為行標(biāo)簽,tr[5]表示第5行,td[]為列標(biāo)簽,td[1]表示第1列。
[0016]S200:對(duì)任一Table標(biāo)簽,配置一map對(duì)象,根據(jù)用戶(hù)輸入的行值和列值,在Table標(biāo)簽中確定一塊第一目標(biāo)區(qū)域,將第一目標(biāo)區(qū)域的元素存入map對(duì)象;任一上述元素在map對(duì)象中的坐標(biāo)與其在Table標(biāo)簽中的坐標(biāo)相同;任一上述元素在map對(duì)象中的坐標(biāo)由key值和value值確定;map對(duì)象是Java中常用的一種元素存儲(chǔ)方法,在存儲(chǔ)元素時(shí),常用“鍵”(key值)和“值”(value值)的方式存儲(chǔ)。本實(shí)施例通過(guò)建立Table標(biāo)簽與map對(duì)象的映射關(guān)系,能夠根據(jù)用戶(hù)配置的行值和列值,將Table標(biāo)簽中的特定元素存入map對(duì)象中。
[0017]例如,當(dāng)前頁(yè)面包含有table1,如果用戶(hù)需要獲取其中第一行、第一列和第一行、第二列的數(shù)據(jù),則可以配置表值為table1,行值為本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.目標(biāo)數(shù)據(jù)抓取方法,用于從至少一個(gè)業(yè)務(wù)平臺(tái)抓取目標(biāo)數(shù)據(jù),所述業(yè)務(wù)平臺(tái)包括多個(gè)頁(yè)面,其特征在于,包括:獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;所述Table標(biāo)簽具有多個(gè)元素,每個(gè)元素在所述Table標(biāo)簽中的坐標(biāo)由行標(biāo)簽和列標(biāo)簽確定;對(duì)任一Table標(biāo)簽,配置一map對(duì)象,根據(jù)用戶(hù)輸入的行值和列值,在Table標(biāo)簽中確定一塊第一目標(biāo)區(qū)域,將第一目標(biāo)區(qū)域的元素存入map對(duì)象;任一所述元素在map對(duì)象中的坐標(biāo)與其在Table標(biāo)簽中的坐標(biāo)相同;任一所述元素在map對(duì)象中的坐標(biāo)由key值和value值確定;根據(jù)用戶(hù)輸入的行值和列值,在所述map對(duì)象中確定一塊第二目標(biāo)區(qū)域,所述第二目標(biāo)區(qū)域的元素作為所述目標(biāo)數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的目標(biāo)數(shù)據(jù)抓取方法,其特征在于,所述獲取當(dāng)前頁(yè)面的html數(shù)據(jù),具體包括:加載瀏覽器驅(qū)動(dòng);加載瀏覽器代理工具,所述瀏覽器代理工具用于全權(quán)代理瀏覽器上所有的http/https訪問(wèn)請(qǐng)求與內(nèi)核API。3.根據(jù)權(quán)利要求2所述的目標(biāo)數(shù)據(jù)抓取方法,其特征在于,所述當(dāng)前頁(yè)面的打開(kāi)方式具體包括:在用戶(hù)設(shè)置為手動(dòng)瀏覽模式時(shí),由用戶(hù)打開(kāi)當(dāng)前頁(yè)面;在用戶(hù)設(shè)置為自動(dòng)瀏覽模式時(shí),由瀏覽器代理工具根據(jù)用戶(hù)配置的訪問(wèn)地址定期打開(kāi)當(dāng)前頁(yè)面。4.根據(jù)權(quán)利要求1所述的目標(biāo)數(shù)據(jù)抓取方法,其特征在于,所述html數(shù)據(jù)還包括JSON數(shù)據(jù),利用Java 的JSON解析器,解析所述html數(shù)據(jù)中的JSON數(shù)據(jù),作為所述目標(biāo)數(shù)據(jù)。5.目標(biāo)數(shù)據(jù)抓取系統(tǒng),用于從至少一個(gè)業(yè)務(wù)平臺(tái)頁(yè)面抓取目標(biāo)數(shù)據(jù),所述業(yè)務(wù)平臺(tái)包括多個(gè)頁(yè)面,其特征在于,包括:第一獲取單元,用于獲取當(dāng)前頁(yè)面的html數(shù)據(jù),提取其中的Table標(biāo)簽;所述Table標(biāo)簽具有多個(gè)元素,每個(gè)元素在所述Table標(biāo)簽中的坐標(biāo)由行標(biāo)簽和列標(biāo)簽確定;第一處理單元,用于對(duì)任一Table標(biāo)簽,配置一map對(duì)象,...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:劉大鵬,徐福虹,劉鵬,
申請(qǐng)(專(zhuān)利權(quán))人:世窗信息股份有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。