• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    騷擾短信判別方法及裝置制造方法及圖紙

    技術(shù)編號(hào):13014738 閱讀:54 留言:0更新日期:2016-03-16 13:21
    本發(fā)明專利技術(shù)提供一種騷擾短信判別方法,包括步驟:解析原始短信內(nèi)容以獲取其中的各個(gè)詞和數(shù)字信息;以所述數(shù)字信息為基準(zhǔn)計(jì)算各個(gè)詞分別到各數(shù)字的距離;將所述距離作為權(quán)重,各個(gè)詞作為維度,對(duì)短信內(nèi)容進(jìn)行描述以生成相應(yīng)的多個(gè)特征向量;將每個(gè)特征向量分別輸入分類模型以獲得輸出結(jié)果;基于所述輸出結(jié)果判別該短信是否為騷擾短信。本發(fā)明專利技術(shù)所述方法或裝置,可以更精確地判斷騷擾短信,能夠提高騷擾短信被攔截的概率,同時(shí)降低對(duì)用戶有用的短信被攔截的概率。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及移動(dòng)終端技術(shù),具體而言,本專利技術(shù)涉及一種騷擾短信判別方法及裝置
    技術(shù)介紹
    隨著信息技術(shù)的發(fā)展,移動(dòng)通信成為人們?nèi)粘Mㄐ诺闹饕侄危娫挕⒁曨l等通信方式以外,短信也作為一種方便快捷的通信方式,成為性價(jià)比最高、覆蓋面最廣的通信方式。但隨之而來(lái)的騷擾短信給用戶帶來(lái)了很大困擾。商家做宣傳、不法分子通過(guò)短信發(fā)釣魚(yú)網(wǎng)址等,會(huì)發(fā)送騷擾短信給用戶。因此,現(xiàn)有技術(shù)為了避免接收大量騷擾短信的推送,會(huì)基于一定的策略判斷當(dāng)前接收的短信是否是對(duì)用戶有用的短信,而將判別為騷擾短信的信息自動(dòng)放入黑名單或刪除,從而防止大量騷擾短信給用戶帶來(lái)的不便。現(xiàn)有技術(shù)通常根據(jù)通訊錄判別短信的發(fā)送方是否為陌生號(hào)碼,以判別該短信是否為騷擾短信,或通過(guò)簡(jiǎn)單的策略對(duì)騷擾短信進(jìn)行過(guò)濾,造成將對(duì)用戶有用的短信誤判成騷擾短信,基于此,需要提供一種更精確的騷擾短信判別方法,以提高判斷騷擾短信的正確率。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的旨在解決上述至少一個(gè)問(wèn)題,提供一種騷擾短信判別方法及裝置,以盡可能正確地判別騷擾短信。為了實(shí)現(xiàn)上述目的,本專利技術(shù)提供一種騷擾短信判別方法,包括以下步驟:解析原始短信內(nèi)容以獲取其中的各個(gè)詞和數(shù)字信息;以所述數(shù)字信息為基準(zhǔn)分別計(jì)算各個(gè)詞到各數(shù)字的距離;將所述距離作為權(quán)重,各個(gè)詞作為維度,對(duì)短信內(nèi)容進(jìn)行描述以生成相應(yīng)的多個(gè)特征向量;將每個(gè)特征向量分別輸入分類模型以獲得輸出結(jié)果;基于所述輸出結(jié)果判別該短信是否為騷擾短信。具體的,所述分類模型為預(yù)先訓(xùn)練的模型,其訓(xùn)練步驟如下:對(duì)樣本集合中的每條原始短信內(nèi)容進(jìn)行解析以獲取其中的各個(gè)詞和數(shù)字信息;以所述數(shù)字信息為基準(zhǔn)計(jì)算各個(gè)詞分別到各個(gè)數(shù)字的距離;將所述相應(yīng)距離作為權(quán)重,各個(gè)詞作為維度,對(duì)每條短信內(nèi)容進(jìn)行描述以生成相應(yīng)的訓(xùn)練樣本;將訓(xùn)練樣本人工標(biāo)記為正樣本和負(fù)樣本;采用所述正樣本和負(fù)樣本訓(xùn)練分類模型。進(jìn)一步,所述對(duì)短信內(nèi)容進(jìn)行描述以生成相應(yīng)的特征向量的具體步驟為:分別以所述各個(gè)數(shù)字作為基準(zhǔn),將其前面和后面的詞作為維度,計(jì)算其前面和后面的詞分別到各個(gè)數(shù)字的距離,將相應(yīng)距離作為權(quán)重,以生成用于描述該短信的多個(gè)特征向量。具體的,所述各個(gè)詞到所述各個(gè)數(shù)字的距離以每個(gè)字作為單位距離進(jìn)行表征。具體的,所述解析步驟具體如下:刪除原始短信中的特定信息;對(duì)短信內(nèi)容基于語(yǔ)法進(jìn)行分詞,以獲取短信中的詞、數(shù)字及相應(yīng)詞性;提取其中的數(shù)字信息。具體的,所述特定信息包括URL、IP地址、移動(dòng)電話、客戶電話、固定電話。較佳的,采用adaboost算法訓(xùn)練分類模型。具體的,所述基于所述輸出結(jié)果判別該短信是否為騷擾短信的具體步驟為:當(dāng)該短信的多個(gè)特征向量中至少存在一個(gè)特征向量的輸出結(jié)果為正確時(shí),則判別該短信為正常短信;否則判別該短信為騷擾短信。優(yōu)選的,所述輸出結(jié)果為1則表征正確,輸出結(jié)果為0則表征錯(cuò)誤。進(jìn)一步,還包括步驟,將分類模型判別為騷擾短信的短信存儲(chǔ)于黑名單。進(jìn)一步,還包括步驟,將判別為騷擾短信的短信從用戶短信列表中刪除。一種騷擾短信判別裝置,包括:解析模塊:用于解析原始短信內(nèi)容以獲取其中的各個(gè)詞和數(shù)字信息;距離計(jì)算模塊:用于以所述數(shù)字信息為基準(zhǔn)分別計(jì)算各個(gè)詞到各數(shù)字的距離;特征向量生成模塊:用于將所述距離作為權(quán)重,各個(gè)詞作為維度,對(duì)短信內(nèi)容進(jìn)行描述以生成相應(yīng)的多個(gè)特征向量;分類模塊:用于將每個(gè)特征向量分別輸入分類模型以獲得輸出結(jié)果;判別模塊:用于基于所述輸出結(jié)果判別該短信是否為騷擾短信。具體的,所述分類模型為預(yù)先訓(xùn)練的模型,基于訓(xùn)練模塊訓(xùn)練生成,所述訓(xùn)練模塊執(zhí)行的步驟如下:對(duì)樣本集合中的每條原始短信內(nèi)容進(jìn)行解析以獲取其中的各個(gè)詞和數(shù)字信息;以所述數(shù)字信息為基準(zhǔn)計(jì)算各個(gè)詞分別到各個(gè)數(shù)字的距離;將所述相應(yīng)距離作為權(quán)重,各個(gè)詞作為維度,對(duì)每條短信內(nèi)容進(jìn)行描述以生成相應(yīng)的訓(xùn)練樣本;將訓(xùn)練樣本人工標(biāo)記為正樣本和負(fù)樣本;采用所述正樣本和負(fù)樣本訓(xùn)練分類模型。具體的,所述特征向量生成模塊執(zhí)行的具體步驟為:分別以所述各個(gè)數(shù)字作為基準(zhǔn),將其前面和后面的詞作為維度,計(jì)算其前面和后面的詞分別到各個(gè)數(shù)字的距離,將相應(yīng)距離作為權(quán)重,以生成用于描述該短信的多個(gè)特征向量。具體的,所述各個(gè)詞到所述各個(gè)數(shù)字的距離以每個(gè)字作為單位距離進(jìn)行表征。具體的,所述解析模塊執(zhí)行的步驟具體如下:刪除原始短信中的特定信息;對(duì)短信內(nèi)容基于語(yǔ)法進(jìn)行分詞,以獲取短信中的詞、數(shù)字及相應(yīng)詞性;提取其中的數(shù)字信息。具體的,所述特定信息包括URL、IP地址、移動(dòng)電話、客戶電話、固定電話。較佳的,所述訓(xùn)練模塊采用adaboost算法訓(xùn)練分類模型。具體的,所述判別模塊執(zhí)行的具體步驟為:當(dāng)該短信的多個(gè)特征向量中至少存在一個(gè)特征向量的輸出結(jié)果為正確時(shí),則判別該短信為正常短信;否則判別該短信為騷擾短信。具體的,所述輸出結(jié)果為1則表征正確,輸出結(jié)果為0則表征錯(cuò)誤。進(jìn)一步,還包括黑名單模塊,用于將分類模型判別為騷擾短信的短信存儲(chǔ)于黑名單。進(jìn)一步,還包括刪除模塊,用于將判別為騷擾短信的短信從用戶短信列表中刪除。相比現(xiàn)有技術(shù),本專利技術(shù)的方案具有以下優(yōu)點(diǎn):本專利技術(shù)通過(guò)對(duì)短信內(nèi)容進(jìn)行分詞解析,提取其中的數(shù)字信息,并以各數(shù)字作為基準(zhǔn)采用各個(gè)詞及分別到各個(gè)數(shù)字的距離為特征描述短信以生成特征向量,通過(guò)預(yù)先訓(xùn)練的分類模型判斷該特征向量是否存在正確的數(shù)字,如果至少存在一個(gè)數(shù)字正確則判斷該短信為正常短信,否則為騷擾短信。基于本專利技術(shù)所述方法進(jìn)行騷擾短信的判斷,能夠更精確確定用戶移動(dòng)終端接收的短信是否為騷擾短信,特別是對(duì)于銀行推送的消費(fèi)信息、物流公司推送的收貨信息等具有有效數(shù)字的信息,降低該些信息被誤判為騷擾短信的概率,進(jìn)一步提高騷擾短信判別的精度。本專利技術(shù)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過(guò)本專利技術(shù)的實(shí)踐了解到。【附圖說(shuō)明】本專利技術(shù)上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為本專利技術(shù)所述騷擾短信判別方法的流程示意圖;圖2為本專利技術(shù)所述短信解析步驟的流程示意圖;圖3為本專利技術(shù)所述分類模型訓(xùn)練步驟的流程示意圖;圖4為本專利技術(shù)所述騷擾短信判別裝置的結(jié)構(gòu)示意圖。【具體實(shí)施方式】下面詳細(xì)描述本專利技術(shù)的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本專利技術(shù),而不能解釋為對(duì)本專利技術(shù)的限制。本
    技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個(gè)”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進(jìn)一步理解的是,本專利技術(shù)的說(shuō)明書(shū)中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當(dāng)我們稱元件被“連接”或“耦接”到另一元件時(shí),它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無(wú)線連接或無(wú)線耦接。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的全部或任一單元和全部組合。本
    技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ)),具有與本專利技術(shù)所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語(yǔ),應(yīng)本文檔來(lái)自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種騷擾短信判別方法,其特征在于,包括以下步驟:解析原始短信內(nèi)容以獲取其中的各個(gè)詞和數(shù)字信息;以所述數(shù)字信息為基準(zhǔn)分別計(jì)算各個(gè)詞到各數(shù)字的距離;將所述距離作為權(quán)重,各個(gè)詞作為維度,對(duì)短信內(nèi)容進(jìn)行描述以生成相應(yīng)的多個(gè)特征向量;將每個(gè)特征向量分別輸入分類模型以獲得輸出結(jié)果;基于所述輸出結(jié)果判別該短信是否為騷擾短信。

    【技術(shù)特征摘要】

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李強(qiáng)張金晶常富洋
    申請(qǐng)(專利權(quán))人:北京奇虎科技有限公司奇智軟件北京有限公司
    類型:發(fā)明
    國(guó)別省市:北京;11

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲精品久久无码| 国产日韩精品中文字无码| 精品深夜AV无码一区二区老年| 色情无码WWW视频无码区小黄鸭| AV无码人妻中文字幕| 永久免费无码网站在线观看| 亚洲熟妇无码八AV在线播放| 亚洲一区AV无码少妇电影| AV无码小缝喷白浆在线观看| 日韩精品无码区免费专区| 亚洲AV无码专区电影在线观看 | 免费人妻av无码专区| 国产综合无码一区二区辣椒 | 国产精品亚洲专区无码WEB| 成人A片产无码免费视频在线观看| 一本天堂ⅴ无码亚洲道久久| 亚洲熟妇无码八AV在线播放| 一道久在线无码加勒比| 亚洲日韩精品无码专区加勒比| 亚洲日韩v无码中文字幕| 成在人线AV无码免费| 日日摸夜夜添无码AVA片| 亚洲午夜国产精品无码老牛影视 | 日韩经典精品无码一区| 精品亚洲AV无码一区二区三区 | 天天看高清无码一区二区三区| 一区二区三区无码被窝影院 | 人妻无码久久中文字幕专区| 亚洲av永久无码精品天堂久久| 东京热无码一区二区三区av| 国产午夜无码视频免费网站| 少妇特殊按摩高潮惨叫无码| 精品人妻无码区在线视频| 亚洲AV无码精品无码麻豆| 中文字幕丰满乱孑伦无码专区| 亚洲一区无码精品色| 国产亚洲精久久久久久无码AV| 精品久久久久久无码人妻热| 一本久道中文无码字幕av| av无码aV天天aV天天爽| 亚洲精品无码日韩国产不卡?V|