本發明專利技術提供了一種基于租車網站評論的情感分析可視化的方法,包括以下步驟:獲取評價數據;構建詞典;對評價數據進行數據預處理;對預處理后的文本數據進行情感分析;統計維度詞和有情感的評價詞的數量;將統計完畢后的數據導入可視化軟件進行數據可視化;將可視化數據通過接口導入網站。經過評論數量的積累后,用戶可以通過查看數據圖表方便,快捷地了解每輛車和租車點的評論,然后選擇自己心儀的汽車租用。這個自然語言處理運用可以增加用戶對租車體驗的滿意度,同時也能讓租車點對自己的服務進行優化。進行優化。進行優化。
【技術實現步驟摘要】
一種基于租車網站評論的情感分析可視化的方法及設備
[0001]本專利技術涉及計算機
,具體涉及一種基于租車網站評論的情感分析可視化的方法及設備。
技術介紹
[0002]隨著人工智能和5G時代的快速發展,運用人工智能技術進行數據分析成為了一個重要的應用方向。在這個快節奏的社會里,人們更喜歡看圖片,圖表等快速準確地獲取有用的信息而不再喜歡看大篇幅的文字。因此,本專利技術提出一種方法和運用,從租車網站中大量用戶的評論中提取有用評論并將它們以圖表形式展示給用戶。
[0003]在目前主流的租車網站中,并沒有找到可以對租車點和汽車進行評論的模塊。這種情況會讓用戶在選擇汽車時產生過多的糾結和猶豫,也會擔心租的汽車是否適合該用戶駕駛。因此,提供用戶進行評論的功能以及將評論以圖表形式可視化將會讓用戶更安心地去租用自己心儀的汽車。
技術實現思路
[0004]本專利技術的目的在于提供一種基于租車網站評論的情感分析可視化的方法及設備,以期解決
技術介紹
中存在的問題。
[0005]為了實現上述目的,本專利技術采用以下技術方案:
[0006]一種基于租車網站評論的情感分析可視化的方法,包括以下步驟:
[0007]獲取評價數據;
[0008]構建詞典;
[0009]對評價數據進行數據預處理;
[0010]對預處理后的文本數據進行情感分析;
[0011]統計維度詞和有情感的評價詞的數量;
[0012]將統計完畢后的數據導入可視化軟件進行數據可視化;
[0013]將可視化數據通過接口導入網站。
[0014]在一些實施例中,所述獲取評價數據,包括:獲取初始汽車評論信息以及系統采集用戶租車完成后對租車點和租用車型的評論。
[0015]隨著網站的運行,用戶的評論增多,不斷擴充數據集。
[0016]數據集數據來源包括但不限于懂車帝,汽車之家等與汽車有關的網站。
[0017]在一些實施例中,所述構建詞典包括,基于獲取評價數據構建情感詞詞典和維度詞詞典。
[0018]在一些實施例中,所述對評價數據進行數據預處理包括,去除重復評論,使用結巴分詞,以及去除停用詞。
[0019]在一些實施例中,所述對預處理后的文本數據進行情感分析包括,對文本數據使用Bert預訓練和深度學習模型進行情感分析。
[0020]在一些實施例中,進行情感分析的方法為:
[0021]將數據集分為訓練集和測試集,并進行Bert預訓練獲得相應的詞向量,再與維度詞詞典的詞ID構建矩陣;
[0022]使用深度神經網絡Bi
?
LSTM模型對數據進行訓練和測試。
[0023]情感分析可視化的方法包括但不限于Bert預訓練+深度學習模型。
[0024]在一些實施例中,使用深度神經網絡Bi
?
LSTM模型對數據進行訓練和測試,包括:設定Bert詞向量維度768,LSTM維度為384,LSTM
?
layers為3,dropout為0.5,選擇雙向循環;模型后面用SoftMax函數和交叉熵損失函數得出評論數據的極性;數據的極性分為
?
1,0,1,分別代表差評,中評,好評三種類型的評論數據。
[0025]在一些實施例中,所述統計維度詞和有情感的評價詞的數量包括,統計每個維度詞相對應的好評,中評以及差評。
[0026]在一些實施例中,所述將統計完畢后的數據導入可視化軟件進行數據可視化包括,將統計后的數據進行整理,按照維度詞進行切片,最終通過可視化軟件進行數據可視化。
[0027]可視化軟件包括但不限于Tableau。
[0028]本申請還提供了一種基于租車網站評論的情感分析可視化的設備,包括:
[0029]信息交互模塊,用于與網站進行交互,接收網站的用戶評論數據,輸入到數據采集模塊,然后獲取從數據可視化模塊返回的結果,并將結果作為答案輸出到網站頁面上;
[0030]數據采集模塊,用于采集任務相關的數據;
[0031]檢索庫模塊,用于構建情感詞詞典和維度詞詞典;
[0032]數據預處理模塊,用于對評論數據進行數據清洗;
[0033]情感分析模塊,用于對評論數據進行情感分析,得出評論是否為好評,中評或者差評;
[0034]數據統計模塊,用于統計各維度詞的好評,中評,差評的數量;
[0035]數據可視化模塊,用于將數據統計模塊的數據以圖表形式展現。
[0036]本申請所提供的一種基于租車網站評論的情感分析可視化的方法具有的有益效果包括但不限于:
[0037]經過評論數量的積累后,用戶可以通過查看數據圖表方便,快捷地了解每輛車和租車點的評論,然后選擇自己心儀的汽車租用。這個自然語言處理運用可以增加用戶對租車體驗的滿意度,同時也能讓租車點對自己的服務進行優化。
附圖說明
[0038]圖1為本基于租車網站評論的情感分析可視化的方法的流程圖;
[0039]圖2為基于租車網站評論的情感分析可視化的裝置結構框圖。
具體實施方式
[0040]為了使本申請的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本申請進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本申請,并不用于限定本申請。
[0041]相反,本申請涵蓋任何由權利要求定義的在本申請的精髓和范圍上做的替代、修改、等效方法以及方案。進一步,為了使公眾對本申請有更好的了解,在下文對本申請的細節描述中,詳盡描述了一些特定的細節部分。對本領域技術人員來說沒有這些細節部分的描述也可以完全理解本申請。
[0042]以下將結合圖1
?
2對本申請實施例所涉及的一種基于租車網站評論的情感分析可視化的方法進行詳細說明。值得注意的是,以下實施例僅僅用于解釋本申請,并不構成對本申請的限定。
[0043]本專利技術的目的在于在租車網站上收集用戶評論并可視化展示出來,這種基于租車網站評論的情感分析可視化的方法的主要難點在于目前還沒有用戶對租用的汽車和該租車點的評論,在使用初期能利用的數據較少,以及初期做出的評論會有一定的誤差。
[0044]本專利技術將在其他汽車網站上獲取對每個車型相應的評論,盡可能在本專利技術使用初期能用顯示較為準確的評論。之后隨著用戶租用汽車的數量增多,網站收集的評論隨之增加,會逐漸地對評論的圖表進行優化。用戶也會對網站顯示的圖表更加信賴。主要包括以下步驟:
[0045]如圖1
?
2所示,一種基于租車網站評論的情感分析可視化的方法,具體包括以下幾個步驟:
[0046]步驟s1:在汽車網站獲取初始汽車評論信息以及系統采集用戶租車完成后對租車點和租用車型的評論;
[0047]步驟s2:建立情感詞詞典以及維度詞詞典;
[0048]步驟s3:對初始數據進行數據預處理;
[0049]步驟s4:對預處理后的文本數據進行情感分析;...
【技術保護點】
【技術特征摘要】
1.一種基于租車網站評論的情感分析可視化的方法,其特征在于,包括以下步驟:獲取評價數據;構建詞典;對評價數據進行數據預處理;對預處理后的文本數據進行情感分析;統計維度詞和有情感的評價詞的數量;將統計完畢后的數據導入可視化軟件進行數據可視化;將可視化數據通過接口導入網站。2.根據權利要求1所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,所述獲取評價數據,包括:獲取初始汽車評論信息以及系統采集用戶租車完成后對租車點和租用車型的評論。3.根據權利要求1所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,所述構建詞典包括,基于獲取評價數據構建情感詞詞典和維度詞詞典。4.根據權利要求1所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,所述對評價數據進行數據預處理包括,去除重復評論,使用結巴分詞,以及去除停用詞。5.根據權利要求1所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,所述對預處理后的文本數據進行情感分析包括,對文本數據使用Bert預訓練和深度學習模型進行情感分析。6.根據權利要求5所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,進行情感分析的方法為:將數據集分為訓練集和測試集,并進行Bert預訓練獲得相應的詞向量,再與維度詞詞典的詞ID構建矩陣;使用深度神經網絡Bi
?
LSTM模型對數據進行訓練和測試。7.根據權利要求6所述的一種基于租車網站評論的情感分析可視化的方法,其特征在于,使用深度神經網絡Bi<...
【專利技術屬性】
技術研發人員:劉峻楓,楊蘭,周興發,司成良,
申請(專利權)人:四川長虹電子控股集團有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。