本發(fā)明專利技術(shù)公開了一種數(shù)據(jù)處理方法及裝置,涉及電通信技術(shù)領(lǐng)域,為解決網(wǎng)頁投放效果評(píng)估結(jié)果準(zhǔn)確性低的問題而發(fā)明專利技術(shù)。本發(fā)明專利技術(shù)的方法包括:獲取用戶行為數(shù)據(jù);查詢記錄所述用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間;計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔;若所述時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則所述記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie;根據(jù)所述穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù)。本發(fā)明專利技術(shù)主要應(yīng)用于獲取數(shù)據(jù)處理的過程中。
Data processing method and device
The invention discloses a data processing method and a device, which relates to the technical field of electric communication, and is invented for solving the problem that the evaluation effect of the webpage delivery effect is low. The method of the invention comprises: acquiring user behavior data; generating time query records the user behavior data of third cookie; the generation time calculation time of the user behavior data and the cookie interval; if the time interval is greater than the preset time, the records of user behavior data third party cookie for stable cookie; according to the stability of cookie, determine the user behavior data for effective data. The invention is mainly used in the process of obtaining data processing.
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種數(shù)據(jù)處理方法及裝置
本專利技術(shù)涉及電通信
,尤其涉及一種數(shù)據(jù)處理方法及裝置。
技術(shù)介紹
cookie是一個(gè)存儲(chǔ)用戶訪問網(wǎng)站時(shí)的部分狀態(tài)、動(dòng)作和設(shè)置的文件。第三方互聯(lián)網(wǎng)監(jiān)測(cè)公司進(jìn)行網(wǎng)頁投放效果評(píng)估時(shí),在網(wǎng)頁植入一段代碼,將記錄在本地cookie中的網(wǎng)民網(wǎng)上瀏覽行為數(shù)據(jù),通過這段代碼發(fā)送給第三方互聯(lián)網(wǎng)監(jiān)測(cè)公司的服務(wù)器,并將cookie記錄的行為數(shù)據(jù)作為主要的分析資源,評(píng)估網(wǎng)頁投放效果。第三方互聯(lián)網(wǎng)監(jiān)測(cè)公司,在使用cookie數(shù)據(jù)時(shí),直接對(duì)數(shù)據(jù)進(jìn)行分析,評(píng)估網(wǎng)頁投放效果。在初始的cookie數(shù)據(jù)集中包含所有對(duì)發(fā)生瀏覽行為或點(diǎn)擊行為的行為數(shù)據(jù)。產(chǎn)生cookie數(shù)據(jù)包括在穩(wěn)定網(wǎng)絡(luò)環(huán)境上網(wǎng)的網(wǎng)民瀏覽行為,以及在不穩(wěn)定網(wǎng)絡(luò)環(huán)境上網(wǎng)的網(wǎng)民瀏覽行為和由作弊產(chǎn)生的網(wǎng)民瀏覽行為。不穩(wěn)定的上網(wǎng)環(huán)境,如在網(wǎng)吧、學(xué)校機(jī)房等地方會(huì)定期清理電腦cookie,當(dāng)同樣的網(wǎng)頁被瀏覽時(shí)會(huì)重新生成新的cookie,cookie更換會(huì)比較頻繁。而由作弊產(chǎn)生的網(wǎng)民瀏覽行為,也會(huì)很頻繁的更換cookie,以更加隱蔽的方式非法增加曝光、流量等。這類頻繁更換cookie的網(wǎng)民瀏覽行為數(shù)據(jù)是不穩(wěn)定的,在網(wǎng)頁投放效果評(píng)估中價(jià)值較低。而穩(wěn)定網(wǎng)絡(luò)環(huán)境上網(wǎng)的網(wǎng)民瀏覽行為,在網(wǎng)頁投放效果評(píng)估中價(jià)值較高。在現(xiàn)有技術(shù)中,在評(píng)估網(wǎng)頁投放效果時(shí),獲取第三方cookie中的全部初始數(shù)據(jù),其中包括穩(wěn)定網(wǎng)民瀏覽行為數(shù)據(jù)和不穩(wěn)定的網(wǎng)民瀏覽行為數(shù)據(jù),不區(qū)分?jǐn)?shù)據(jù)的穩(wěn)定性,直接進(jìn)行處理數(shù)據(jù)。由于不穩(wěn)定的網(wǎng)民瀏覽行為數(shù)據(jù),對(duì)網(wǎng)頁效果評(píng)估中的價(jià)值較低,而在數(shù)據(jù)處理過程中與穩(wěn)定網(wǎng)民瀏覽行為數(shù)據(jù)做同樣的數(shù)據(jù)處理,降低了網(wǎng)頁投放效果評(píng)估結(jié)果的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)提供了一種數(shù)據(jù)處理方法及裝置,能夠解決網(wǎng)頁投放效果評(píng)估結(jié)果準(zhǔn)確性低的問題。為了解決上述技術(shù)問題,一方面,本專利技術(shù)提供了一種數(shù)據(jù)處理方法,該方法包括:獲取用戶行為數(shù)據(jù);查詢記錄所述用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間;計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔;若所述時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則所述記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie;根據(jù)所述穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù)。另一方面,本專利技術(shù)還提供了一種數(shù)據(jù)處理裝置,該裝置包括:獲取單元,用于獲取用戶行為數(shù)據(jù);查詢單元,用于查詢記錄所述獲取單元獲取的用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間;計(jì)算單元,用于計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述查詢單元查詢的cookie的生成時(shí)間的時(shí)間間隔;記錄單元,用于若所述計(jì)算單元計(jì)算的時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則所述記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie;確定單元,用于根據(jù)所述記錄單元記錄的穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù)。本專利技術(shù)提供的數(shù)據(jù)處理方法及裝置,能夠獲取用戶行為數(shù)據(jù),查詢記錄用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間,計(jì)算用戶行為數(shù)據(jù)產(chǎn)生的時(shí)間與第三方cookie的生成時(shí)間的時(shí)間間隔,若時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie,穩(wěn)定cookie中記錄的用戶行為數(shù)據(jù)為有效數(shù)據(jù)。與現(xiàn)有技術(shù)相比,本專利技術(shù)能夠從cookie記錄的大量行為數(shù)據(jù)中,排除不穩(wěn)定的無效數(shù)據(jù),獲取穩(wěn)定的有效的行為數(shù)據(jù),根據(jù)高價(jià)值的有效行為數(shù)據(jù),分析投放效果,提高評(píng)估網(wǎng)頁投放效果的準(zhǔn)確性。上述說明僅是本專利技術(shù)技術(shù)方案的概述,為了能夠更清楚了解本專利技術(shù)的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本專利技術(shù)的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本專利技術(shù)的具體實(shí)施方式。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本專利技術(shù)的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:圖1示出了本專利技術(shù)實(shí)施例提供的一種數(shù)據(jù)處理方法流程圖;圖2示出了本專利技術(shù)實(shí)施例提供的另一種數(shù)據(jù)處理方法流程圖;圖3示出了本專利技術(shù)實(shí)施例提供的一種數(shù)據(jù)處理裝置組成框圖;圖4示出了本專利技術(shù)實(shí)施例提供的另一種數(shù)據(jù)處理裝置組成框圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。本專利技術(shù)實(shí)施例提供了一種數(shù)據(jù)處理方法,如圖1所示,該方法包括:101、獲取用戶行為數(shù)據(jù)。用戶行為數(shù)據(jù)可以至少包含下述一種:對(duì)網(wǎng)絡(luò)事件的觸發(fā)動(dòng)作,如對(duì)廣告的點(diǎn)擊;對(duì)網(wǎng)絡(luò)展示內(nèi)容瀏覽時(shí)間,如廣告的曝光統(tǒng)計(jì)可以根據(jù)用戶對(duì)廣告瀏覽時(shí)間來確定;訪問網(wǎng)站時(shí)間;等上述三種用戶行為數(shù)據(jù)。具體地,用戶行為數(shù)據(jù)可以由用戶對(duì)目標(biāo)頁面操作產(chǎn)生,目標(biāo)頁面可以是游戲頁面,廣告頁面,購(gòu)物頁面等等,在專利技術(shù)方案中,對(duì)目標(biāo)頁面的類型不做限定。用戶行為數(shù)據(jù)是用戶訪問網(wǎng)站及在網(wǎng)站上的其他操作所產(chǎn)生的信息。這些信息可以以日志的形式存放在用戶本地cookie中。cookie是一個(gè)存儲(chǔ)用戶訪問網(wǎng)絡(luò)時(shí)的部分狀態(tài)、動(dòng)作和設(shè)置的文件,一般包括所訪問網(wǎng)站的域名、訪問開始時(shí)間、訪問者的IP地址以及訪問者關(guān)于網(wǎng)站的一些設(shè)置。獲取的用戶行為數(shù)據(jù),是為了分析某一個(gè)或某幾個(gè)目標(biāo)頁面的運(yùn)作效果,而不是對(duì)所有的網(wǎng)絡(luò)用戶而言的。所以在目標(biāo)頁面中植入一段代碼,這段代碼能夠給點(diǎn)擊目標(biāo)頁面的用戶分配一個(gè)cookie編號(hào),與該用戶在目標(biāo)頁面產(chǎn)生的其他行為數(shù)據(jù)記錄在本地cookie中,并將記錄在本地cookie中的行為數(shù)據(jù),通過這段代碼發(fā)送給第三方互聯(lián)網(wǎng)監(jiān)測(cè)公司。這樣從第三方互聯(lián)網(wǎng)監(jiān)測(cè)方的cookie中只包括用戶點(diǎn)擊目標(biāo)頁面的行為數(shù)據(jù),而不是用戶本地所有的cookie,減少后續(xù)數(shù)據(jù)處理的數(shù)據(jù)量,提高數(shù)據(jù)處理的效率。用戶首次點(diǎn)擊目標(biāo)頁面時(shí),生成一個(gè)cookie,當(dāng)用戶再次點(diǎn)擊目標(biāo)頁面時(shí),用戶行為數(shù)據(jù)記錄在首次生成的cookie中,記錄行為數(shù)據(jù)時(shí)不再分配新的cookie編號(hào)。這樣可以通過cookie編號(hào)區(qū)別不同的用戶。102、查詢記錄用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間。第三方cookie,是指用戶當(dāng)前瀏覽的頁面上有通過標(biāo)簽嵌入另外一個(gè)域名的鏈接地址,該鏈接設(shè)置的cookie就稱為第三方cookie,當(dāng)前頁面設(shè)置的cookie為第一方cookie。第三方cookie的生成時(shí)間,是在用戶首次點(diǎn)擊目標(biāo)頁面時(shí)產(chǎn)生的。查詢記錄行為數(shù)據(jù)的cookie生成時(shí)間,即查詢用戶首次點(diǎn)擊目標(biāo)頁面的時(shí)間。103、計(jì)算用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與cookie的生成時(shí)間的時(shí)間間隔。通過步驟101獲取的用戶行為數(shù)據(jù),得到用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間,通過步驟102得到cookie的生成時(shí)間,計(jì)算兩者的時(shí)間間隔。通常時(shí)間的記錄包括年、月、日、時(shí)、分、秒。在計(jì)算時(shí)間間隔時(shí),可以根據(jù)最小時(shí)間單位,統(tǒng)一時(shí)間單位進(jìn)行逐項(xiàng)對(duì)比,計(jì)算時(shí)間差;對(duì)于時(shí)間間隔的計(jì)算方式本專利技術(shù)在此不做任何限定。示例性的,行為數(shù)據(jù)的產(chǎn)生時(shí)間為2015年11月2日8時(shí)23分10秒,cookie的生成時(shí)間為2015年11月1日9時(shí)10分5秒,兩者做減法運(yùn)算,與十進(jìn)制減法類似,從最小時(shí)間單位秒開始,計(jì)算兩者的本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】
一種數(shù)據(jù)處理方法,其特征在于,所述方法包括:獲取用戶行為數(shù)據(jù);查詢記錄所述用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間;計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔;若所述時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則所述記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie;根據(jù)所述穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù)。
【技術(shù)特征摘要】
1.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括:獲取用戶行為數(shù)據(jù);查詢記錄所述用戶行為數(shù)據(jù)的第三方cookie的生成時(shí)間;計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔;若所述時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng),則所述記錄用戶行為數(shù)據(jù)的第三方cookie為穩(wěn)定cookie;根據(jù)所述穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述用戶行為數(shù)據(jù),至少包含下述一種:對(duì)網(wǎng)絡(luò)事件的觸發(fā)動(dòng)作;對(duì)網(wǎng)絡(luò)展示內(nèi)容瀏覽時(shí)間;訪問網(wǎng)站時(shí)間。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔,包括:計(jì)算當(dāng)前所述用戶行為數(shù)據(jù)的產(chǎn)生的時(shí)間與所述第三方cookie的生成時(shí)間的時(shí)間差;根據(jù)所述時(shí)間差,確定時(shí)間誤差率;利用所述時(shí)間誤差率,計(jì)算所述用戶行為數(shù)據(jù)的產(chǎn)生時(shí)間與所述cookie的生成時(shí)間的時(shí)間間隔。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述穩(wěn)定cookie,確定所述用戶行為數(shù)據(jù)為有效數(shù)據(jù),包括:當(dāng)所述時(shí)間間隔大于預(yù)設(shè)時(shí)長(zhǎng)時(shí),檢測(cè)是否存在與所述用戶行為數(shù)據(jù)相關(guān)的其他用戶行為數(shù)據(jù);當(dāng)存在與所述用戶行為數(shù)據(jù)相關(guān)的其他用戶行為數(shù)據(jù),獲取所述其他用戶行為數(shù)據(jù);將所述用戶行為數(shù)據(jù)和所述用戶行為數(shù)據(jù)相關(guān)的其他用戶行為數(shù)據(jù),確定為有效數(shù)據(jù)。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:統(tǒng)計(jì)所述有效數(shù)據(jù)的穩(wěn)定網(wǎng)民曝光量;統(tǒng)計(jì)所述有效數(shù)據(jù)的穩(wěn)定網(wǎng)民獨(dú)立曝光量。6.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:獲取單元,用于獲取用戶行為數(shù)據(jù);查詢單元,用于查詢記錄所述獲...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:趙冬玲,
申請(qǐng)(專利權(quán))人:北京國(guó)雙科技有限公司,
類型:發(fā)明
國(guó)別省市:北京,11
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。