• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種網絡輿情地理位置實時監控系統和方法技術方案

    技術編號:8682830 閱讀:247 留言:0更新日期:2013-05-09 02:45
    本發明專利技術公布了一種網絡輿情地理位置實時監控系統和方法。通過統一微博、博客、論壇數據的獲取方式,相似度分析去重,得到話題關鍵詞列表;采取首尾邊界切割技術提取地理位置和時間信息,通過事先建立好的網站結構表獲取首尾邊界,避免程序需要根據網站結構進行調整的情況出現;根據每一個關鍵詞獲取數據并進行數據處理,在GIS地理模型上動態還原其傳播態勢,分析網民參與人數。通過將網絡地理位置轉換成經緯度坐標,實現網絡環境和真實環境的映射,對數據按時間段分批輸入GIS軟件實現動態演示傳播過程。

    【技術實現步驟摘要】

    本專利技術涉及網絡信息
    ,具體涉及一種網絡輿情地理位置傳播、分布實時監控技術。
    技術介紹
    隨著網絡大力普及,人們越來越習慣在網絡表達自己的觀點,并且由于網絡的龐大性和隱匿性,導致觀點的表達更加真實、大膽,網絡輿情逐漸引起人們的廣泛關注。網絡輿情具有一定地域特點,網絡的熱點話題也是社會中的熱點話題,尋找網絡輿情和社會輿情的聯系,將輿情在網絡上的傳播和其在地理位置上的傳播聯系起來,是網絡輿情的一個研究趨勢。但目前在輿情監控應用領域中,存在以下的問題:I)數據來源的局限性;當前輿情監控系統大多局限在某種或者某類特定的網絡形態,導致輿情監控不夠全面。2)網絡輿情和社會輿情的聯系性較弱;當前大多輿情分析主要針對網絡行為開展,忽略網絡輿情的地域特征,也就是說沒有和社會輿情相聯系。申請號為201210216349.X的專利技術專利申請“一種輿情信息展示系統及方法”對包含輿情信息的網頁進行地域識別,客觀、直觀地反映了不同地域的輿情信息,屬于輿情的統計分析靜態展示,沒有對特定輿情傳播過程的動態展示;其地域識別模塊,適于對所述正文信息進行地域識別,以獲得所述正文信息的所屬地域并對具有相同所屬地域的網頁進行數量統計,該模塊所完成的數據處理功能僅僅是對含有地域屬性的網頁數量進行統計,不涉及用戶對話題的討論過程演變,對特定的某個輿情,缺乏針對性,無法完成對特定輿情熱點的監控。申請號為201110127509.9的專利技術專利申請“網絡輿情危機預警方法”屬于對網絡熱點話題的監測和預警,沒有對每一個熱點話題在網絡上的傳播態勢進行分析,也沒有對網絡熱點話題在現實社會城市之間的傳播態勢進行分析,不適用于對社會輿情的觀察和預 m目O
    技術實現思路
    本專利技術針對現有技術存在的上述問題,提供一種網絡輿情地理位置傳播、分布實時監控系統。本專利技術解決上述技術問題的技術方案是:一種網絡輿情地理位置實時監控系統,其特征在于,包括:數據采集模塊、數據處理模塊、動態展示模塊、分析報告模塊;其中,數據采集模塊預先將含有用戶所在地的用戶注冊信息存到本地,獲取微博、博客、論壇的熱點關鍵詞,建立關鍵詞列表(可采用相似度檢測技術對關鍵詞去重),依次從微博、博客、論壇搜索每個關鍵詞并將網頁源碼保存到本地;數據處理模塊采用字符串首尾邊界切割技術,統一微博、博客、論壇等各種網絡形態的數據處理方式,從搜索結果網頁源碼中截取時間及與地理位置有關的信息,并建立地理位置與經緯度坐標的映射;按照輿情傳播時間的先后順序對所獲取的話題討論相關內容排序,按用戶設定的時間間隔對排序后的內容按照定長時間段分批;動態展示模塊讀取已分批內容的地理位置信息并轉換為經緯度坐標,按批依次載入GIS系統進行傳播動態展示,根據經緯度坐標動態標記定位網民對該熱點關鍵詞的討論傳播情況,并繪制該熱點關鍵詞各地網民關注數量隨時間變化的曲線;分析報告模塊存儲演示結果并對網民地域分布人數做定量分析。具體為:所述數據采集模塊包括:用戶數據采集模塊、關鍵詞采集模塊、話題信息采集模塊。用戶數據采集模塊實時采集網絡信息,通過預處理把含有地理位置屬性的用戶注冊信息保存到用戶注冊信息表,當參與某話題討論的用戶存在于表中時,可直接提取其地理位置信息,若不存在,先進入個人主頁提取其地理位置信息并更新用戶注冊信息表。關鍵詞采集模塊自動獲取微博、博客、論壇的熱點關鍵詞,通過文本聚類的方法進行相似度檢測并去重,得到關鍵詞列表。話題信息采集模塊根據關鍵詞搜索所有話題并保存搜索結果網頁源碼。數據處理模塊包括:提取時間地點模塊、地點轉換經緯度模塊、數據按時間分批模塊。提取時間地點模塊采用字符串首尾邊界切割技術,直接鎖定待提取信息的位置,從網頁源碼中提取和地理位置傳播相關的信息,在不需要修改源程序的情況下,對各種網頁結構進行統一處理;地點轉換經緯度模塊完成城市名稱和其經緯度坐標的映射,用于GIS定位;數據按時間分批模塊對已獲取數據,按照信息傳播時間先后排序,以用戶所設定的時間間隔對數據分批。動態展示模塊包括:GIS系統動態展示傳播模塊、網民地域分布實時變化模塊。GIS系統動態展示傳播模塊將分批后的數據依次載入GIS系統,按照經緯度坐標定位并動態標注其傳播位置,采用立方體或圓柱體等帶有高度的自定義地標,依次標識每一批城市,同一批地理位置地標具有相同的高度,處于不同批次同一地理位置的標注點通過對經緯度小量的改變,使地標處于之前地標的周圍位置,地標的高度差用來區分不同的傳播批次,地標的密度用來區分不同地域該特定輿情的密度,以便觀察。網民地域分布實時變化模塊,在χ-y坐標系中繪制不同省市參與某關鍵詞討論網民的數量隨時間變化的趨勢,可一條曲線代表一個城市的情況。動態展示模塊和網民地域分布展示模塊同步動態展示,前者從數據庫讀取分批次的經緯度坐標集,依次標注傳播態勢,后者將每一批每一個城市的網民數量繪制為一個點,隨時間推移,動態連接這些點。分析報告模塊包括:存檔演示結果圖模塊、數據分析模塊。存檔演示結果圖保存每一個關鍵詞所代表的熱點話題在地圖上標注后的分布情況圖,以及網民分布曲線圖。數據分析模塊對演示結果進行定量分析,如對網民省市分布情況以表格的形式量化。一種網絡輿情地理位置實時監控方法,數據采集模塊預先將用戶注冊信息存儲到本地,獲取微博、博客、論壇的熱點關鍵詞,對關鍵詞進行相似度檢測并去重,建立關鍵詞列表,依次從微博、博客、論壇搜索每個關鍵詞并將網頁源碼保存到本地;數據處理模塊使用字符串首尾邊界切割技術,從微博、博客、論壇的搜索結果網頁源碼中提取時間和地理位置傳播相關信息,根據地理位置建立與經緯度坐標的映射,按照輿情傳播時間的先后順序對所獲取的話題討論相關內容排序,按用戶設定的時間間隔對排序后的內容按照定長時間段分批;動態展示模塊讀取分批數據,按批依次載入地理信息系統,進行地理坐標標識,根據經緯度坐標定位標記熱點關鍵詞,進行信息傳播動態演示,并繪制熱點關鍵詞隨時間變化的曲線;分析報告模塊存儲演示結果并對網民地域分布人數做定量分析。對信息字符串首尾邊界切割具體為,根據各網絡形態的網頁源碼,查找所要提取目標字符串首和尾的唯一字符串標識,使用字符串切割功能,將目標字符串提取出來。對于不提供IP的網站,預處理模塊搜索網站所有用戶的個人信息主頁,使用字符串首尾邊界切割技術提取用戶名和注冊地點存入用戶注冊信息表。如果有IP地址,則查找IP地址和地理位置信息映射表,將IP地址轉換為城市名稱,保證待處理數據集中僅含有時間和城市名稱兩個屬性。數據處理模塊從搜索結果網頁源碼中,根據目標信息標識表中對應的該網站的各個標識,使用字符串首尾邊界切割技術提取其中的用戶名、話題內容、IP、時間等信息存入數據庫。本專利技術相對于現有技術,將微博、博客、論壇的數據處理方式進行統一,通過熱榜建立關鍵詞列表,按關鍵詞搜索并獲取網頁內容,包括傳播時間、地點/IP和發布、轉發和評論者,將網絡輿情的傳播和社會輿情的傳播對應,借助Gis軟件,動態還原傳播過程。本專利技術在地理位置信息獲取的處理之上,把不能直接獲取城市或IP信息的網站,提前對用戶信息進行預處理,保存用戶注冊城市,以保障系統運行實時性。輸入關鍵詞列表和自動獲取關鍵詞列表既可以滿足用戶對特定話題傳播動向觀察的需求,也可以實現全網絡實時監控。另一本文檔來自技高網
    ...

    【技術保護點】
    一種網絡輿情地理位置實時監控系統,其特征在于,包括:數據采集模塊、數據處理模塊、動態展示模塊、分析報告模塊,數據采集模塊預先將用戶注冊信息存儲到本地,獲取微博、博客、論壇的熱點關鍵詞,對關鍵詞進行相似度檢測并去重,建立關鍵詞列表,依次將每個關鍵詞對應的網頁源碼保存到本地;數據處理模塊采用字符串首尾邊界切割從搜索的網頁源碼中提取時間和地理位置信息,根據地理位置建立與經緯度坐標的映射,按照關鍵詞傳播時間的先后順序對所獲取的內容排序,按預定時間間隔對排序后的內容按照定長時間段分批;動態展示模塊讀取分批數據,按批次載入地理信息系統,進行地理坐標標識,根據經緯度坐標繪制地標,以實現信息傳播動態演示,并繪制熱點關鍵詞隨時間變化的曲線;分析報告模塊存儲演示結果并對網民地域分布人數做定量分析。

    【技術特征摘要】
    1.一種網絡輿情地理位置實時監控系統,其特征在于,包括:數據采集模塊、數據處理模塊、動態展示模塊、分析報告模塊,數據采集模塊預先將用戶注冊信息存儲到本地,獲取微博、博客、論壇的熱點關鍵詞,對關鍵詞進行相似度檢測并去重,建立關鍵詞列表,依次將每個關鍵詞對應的網頁源碼保存到本地;數據處理模塊采用字符串首尾邊界切割從搜索的網頁源碼中提取時間和地理位置信息,根據地理位置建立與經緯度坐標的映射,按照關鍵詞傳播時間的先后順序對所獲取的內容排序,按預定時間間隔對排序后的內容按照定長時間段分批;動態展示模塊讀取分批數據,按批次載入地理信息系統,進行地理坐標標識,根據經緯度坐標繪制地標,以實現信息傳播動態演示,并繪制熱點關鍵詞隨時間變化的曲線;分析報告模塊存儲演示結果并對網民地域分布人數做定量分析。2.根據權利要求1所述的網絡輿情地理位置實時監控系統,其特征在于,字符串首尾邊界切割具體為,查找所要提取目標字符串首和尾的唯一字符串標識,使用字符串切割功能,將網頁源碼中的目標字符串提取出來。3.根據權利要求1所述的網絡輿情地理位置實時監控系統,其特征在于,對于不提供IP地址的網站,預處理模塊搜索網站所有用戶的個人信息主頁,根據字符串首尾邊界切割提取用戶名和注冊地點存入用戶注冊信息表。4.根據權利要求1所述的網絡輿情地理位置實時監控系統,其特征在于,數據采集模塊中話題信息采集模塊使用微博、博客或論壇提供的搜索功能,將搜索獲得的所有頁面的源碼保存在本地,提取時間地點模塊提取源碼中的用戶名、熱點詞相關內容、IP地址、時間信息存入數據庫中。5.根據權利要求1所述的網絡輿情地理位置實時監控系統,其特征在于,如果有IP地址,則查找IP地址和地理位置信息映射表,將IP地址轉換為城市名稱,保證待處理數據集中僅含有時間和城市名稱兩個屬性。6.一種網絡輿情地理位置實時...

    【專利技術屬性】
    技術研發人員:吳渝李紅波耿文靜李強
    申請(專利權)人:重慶郵電大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品无码无人网站免费视频 | 久久无码AV中文出轨人妻| 国产亚洲精品无码专区| 无码AV岛国片在线播放| 国产免费AV片无码永久免费| 国产成人午夜无码电影在线观看| 人妻无码一区二区三区AV| 久久午夜无码鲁丝片午夜精品| 91久久九九无码成人网站| 中文字幕av无码一区二区三区电影 | 99久久无码一区人妻a黑 | 人妻丰满熟妇AV无码区HD| 精品亚洲成A人无码成A在线观看| 日韩精品无码免费专区午夜不卡| 亚洲国产成人精品无码一区二区 | 日韩中文无码有码免费视频| 亚洲精品无码专区在线在线播放| 久久亚洲精品成人无码| 无码人妻一区二区三区免费手机| 国产成人AV片无码免费| 少妇性饥渴无码A区免费| 免费无遮挡无码视频在线观看| 中文字幕乱偷无码av先锋蜜桃| 亚洲国产精品成人精品无码区 | 国产网红主播无码精品| 免费无遮挡无码视频网站| 亚洲中文无码av永久| 人妻少妇偷人精品无码 | 国产台湾无码AV片在线观看| 国产精品国产免费无码专区不卡| 国产成人无码AV麻豆| 亚洲天堂2017无码中文| AV无码久久久久不卡蜜桃 | 无码少妇A片一区二区三区| 久久精品亚洲中文字幕无码麻豆| 亚洲AV无码乱码国产麻豆| 亚洲AV无码乱码在线观看裸奔 | 高清无码午夜福利在线观看| 精品无码久久久久久午夜| 亚洲一区二区三区国产精品无码| 无码夫の前で人妻を侵犯|