• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于位置服務采集新浪微博團購信息的方法技術(shù)

    技術(shù)編號:8736086 閱讀:322 留言:0更新日期:2013-05-26 12:05
    本發(fā)明專利技術(shù)是一種基于位置服務采集新浪微博團購信息的方法,為了使得商家用戶能實時發(fā)布團購消息,普通用戶也能實時看到不同位置的團購信息,商家用戶通過新浪微博平臺發(fā)布團購信息,首先,利用新浪微博提供的開放位置服務接口,抽取在該位置附近發(fā)布的所有的微博數(shù)據(jù)信息;然后,將抽取出來的微博數(shù)據(jù)存放在數(shù)據(jù)庫中,針對這些微博數(shù)據(jù)進行語料模式匹配預處理操作;接著,初步篩選出所有包含團購信息特征的微博數(shù)據(jù);其次,使用語義分析技術(shù),確定該條數(shù)據(jù)是否為團購信息;最后,成功地將團購信息從某一位置發(fā)布大量的微博數(shù)據(jù)中采集出來。

    【技術(shù)實現(xiàn)步驟摘要】

    【技術(shù)保護點】
    一種基于位置服務采集新浪微博團購信息的方法,其特征在于該方法所包含的步驟為:步驟1)?抽取在某一具體位置附近發(fā)布微博的數(shù)據(jù)集信息:步驟1.1)?獲取申請新浪微博應用的相關(guān)信息;步驟1.2)?分配授權(quán)信息;步驟1.3)?獲取用戶的該位置信息;步驟1.4)?根據(jù)位置服務的動態(tài)信息接口,抽取該位置附近發(fā)布的所有微博數(shù)據(jù)信息;步驟1.5)?存儲抽取的所有微博數(shù)據(jù)信息;?步驟2)?預處理微博數(shù)據(jù)集信息:步驟2.1)?獲取微博數(shù)據(jù)集信息;步驟2.2)?獲取團購語料庫;步驟2.3)?初始化微博數(shù)據(jù)集中團購的相關(guān)信息:步驟2.3.1)?初始化微博數(shù)據(jù)集中的團購信息標志為1;步驟2.3.2)?初始化微博數(shù)據(jù)集中的團購關(guān)鍵詞匹配次數(shù)為0;步驟2.4)?獲取第一條微博數(shù)據(jù)信息;步驟2.5)?判斷該微博數(shù)據(jù)是否包含團購語料庫中的詞語,如果包含,轉(zhuǎn)步驟2.6),否則,轉(zhuǎn)步驟2.8);步驟2.6)?計算微博數(shù)據(jù)匹配語料庫關(guān)鍵詞的次數(shù);步驟2.7)?更新微博團購關(guān)鍵詞匹配的次數(shù);步驟2.8)?更新該微博數(shù)據(jù)的團購信息標志為0;步驟2.9)?獲取下一條微博數(shù)據(jù)信息;步驟2.10)?判斷該微博數(shù)據(jù)信息是否到達微博數(shù)據(jù)集的末端,如果到達,轉(zhuǎn)步驟2.11),否則,轉(zhuǎn)步驟2.5);步驟2.11)?刪除團購信息標志為0的所有微博數(shù)據(jù);步驟2.12)?更新微博數(shù)據(jù)集信息;?步驟3)?對微博數(shù)據(jù)集進行分句:步驟3.1)?獲取微博數(shù)據(jù)集中的第一條數(shù)據(jù)信息;步驟3.2)?獲取該微博數(shù)據(jù)中的第一個字符信息;步驟3.3)?判斷該字符是否為“;”,如果是,轉(zhuǎn)步驟3.8),否則,轉(zhuǎn)步驟3.4);步驟3.4)?判斷該字符是否為?如果是,轉(zhuǎn)步驟3.8),否則,轉(zhuǎn)步驟3.5);步驟3.5)?判斷該字符是否為“!”,如果是,轉(zhuǎn)步驟3.8),否則,轉(zhuǎn)步驟3.6);步驟3.6)?判斷該字符是否為“,”,如果是,轉(zhuǎn)步驟3.8),否則,轉(zhuǎn)步驟3.7);步驟3.7)?判斷該字符是否為“?”,如果是,轉(zhuǎn)步驟3.8),否則,轉(zhuǎn)步驟3.9);步驟3.8)?置換該字符為分句標識,用“/j”表示;步驟3.9)?獲取下一個微博數(shù)據(jù)字符信息;步驟3.10)?判斷是否到達微博數(shù)據(jù)的末端,如果到達,轉(zhuǎn)步驟3.11),否則,轉(zhuǎn)步驟3.3);步驟3.11)?更新微博數(shù)據(jù)信息;步驟3.12)?獲取下一條微博數(shù)據(jù)信息;步驟3.13)?判斷該微博數(shù)據(jù)是否為微博數(shù)據(jù)集的末端,如果到達,轉(zhuǎn)步驟3.14),否則,轉(zhuǎn)步驟3.2);步驟3.14)?更新微博數(shù)據(jù)集信息;?步驟4)?對微博數(shù)據(jù)集進行分詞,并標注詞性:步驟4.1)?獲取微博數(shù)據(jù)集中第一條數(shù)據(jù)信息;步驟4.2)?獲取該微博數(shù)據(jù)中的第一個字符信息;步驟4.3)?判斷該字符是否為分句標識,如果是,轉(zhuǎn)步驟4.4),否則,轉(zhuǎn)步驟4.6);步驟4.4)?設置分詞等級;步驟4.5)?根據(jù)分詞函數(shù),標注詞性;步驟4.6)?獲取下一個微博數(shù)據(jù)字符信息;步驟4.7)?判斷是否到達微博數(shù)據(jù)的末端,如果到達,轉(zhuǎn)步驟4.8),否則,轉(zhuǎn)步驟4.3);步驟4.8)?存儲分詞后的數(shù)據(jù)信息;步驟4.9)?獲取下一條微博數(shù)據(jù)信息;步驟4.10)?判斷該微博數(shù)據(jù)是否為微博數(shù)據(jù)集的末端,如果到達,轉(zhuǎn)步驟4.11),否則,轉(zhuǎn)步驟4.2);步驟4.11)?更新微博數(shù)據(jù)集信息;?步驟5)?抽取微博數(shù)據(jù)集中的團購事件:步驟5.1)?獲取微博數(shù)據(jù)集中第一條數(shù)據(jù)信息;步驟5.2)?獲取該微博數(shù)據(jù)中的第一個字符信息;步驟5.3)?判斷該字符是否為分句標識,如果是,轉(zhuǎn)步驟5.4),否則,轉(zhuǎn)步驟5.14);步驟5.4)?根據(jù)該句子的句法,標注詞性;步驟5.5)?分析事件的語義特征;步驟5.6)?映射事件的命題實體;步驟5.7)?映射事件的代指概念;步驟5.8)?識別該句子中的動詞;步驟5.9)?分析事件的論元結(jié)構(gòu)屬性;步驟5.10)?映射論元;步驟5.11)?完成該句子的事件抽取;步驟5.12)?判斷該事件是否為團購事件,如果是,轉(zhuǎn)步驟5.13),否則,轉(zhuǎn)步驟5.14);步驟5.13)?更新該微博數(shù)據(jù)的團購信息標志為2;步驟5.14)?獲取下一個微博數(shù)據(jù)字符;步驟5.15)?判斷該微博數(shù)據(jù)字符是否到達微博數(shù)據(jù)的末端,如果到達,轉(zhuǎn)步驟5.16),否則,轉(zhuǎn)步驟5.3);步驟5.16)?獲取下一條微博數(shù)據(jù)信息;步驟5.17)?判斷該微博數(shù)據(jù)是否到達微博數(shù)據(jù)集的末端,如果到達,轉(zhuǎn)步驟5.18),否則,轉(zhuǎn)步驟5.2);步驟5.18)?更新微博數(shù)據(jù)集信息;步驟5.19)?完成團購事件的抽取。2013100207731100001dest_path_image001.jpg...

    【技術(shù)特征摘要】

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:張衛(wèi)豐王云周國強張迎周王子元周國富錢小燕許碧歡陸柳敏
    申請(專利權(quán))人:南京郵電大學
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 欧洲黑大粗无码免费| 无码av免费一区二区三区试看| 亚洲国产精品无码久久久| 久久亚洲精品AB无码播放| 18禁网站免费无遮挡无码中文 | 国产精品国产免费无码专区不卡| 办公室丝袜激情无码播放| 亚洲熟妇无码AV在线播放| 无码人妻一区二区三区兔费| 成在人线av无码免费高潮水| 色综合99久久久无码国产精品| 永久免费AV无码网站国产| 麻豆亚洲AV成人无码久久精品| 亚洲综合无码精品一区二区三区| 亚洲av无码专区国产不乱码| 日韩免费无码一区二区三区| 国产成人无码精品久久久性色 | 无码不卡亚洲成?人片| 亚洲AV无码专区电影在线观看| 东京热一精品无码AV| 日韩免费无码一区二区三区 | 国产成人无码av在线播放不卡| 欧洲Av无码放荡人妇网站| 中文有无人妻vs无码人妻激烈 | 中文字幕无码第1页| 自慰系列无码专区| 亚洲av无码偷拍在线观看| 亚洲av无码一区二区三区天堂古代| 国产免费无码AV片在线观看不卡| 日产无码1区2区在线观看| 国产成人亚洲精品无码AV大片| 岛国av无码免费无禁网站| 亚洲精品中文字幕无码A片老| 久久亚洲AV成人无码国产| 亚洲AV永久无码区成人网站| 亚洲国产精品无码久久久不卡| 伊人久久综合无码成人网| 亚洲AV无码一区二区三区DV| 人妻丝袜无码专区视频网站| 亚洲精品无码成人片在线观看| 本道天堂成在人线av无码免费|