• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法技術(shù)

    技術(shù)編號:36690935 閱讀:35 留言:0更新日期:2023-02-27 19:58
    本發(fā)明專利技術(shù)提供一種神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法,模型包括提取樣本特征的特征提取器和根據(jù)樣本特征對樣本分類的分類器,該方法包括按以下方式對基于源域的樣本及標(biāo)簽訓(xùn)練得到的初始的模型進(jìn)行一輪或多輪訓(xùn)練:S1、獲取訓(xùn)練集,包括源域的樣本對和目標(biāo)域的樣本對,任意樣本對包括兩個樣本,每個樣本為對人員采集的傳感器數(shù)據(jù),兩個樣本所對應(yīng)的人員和被采集時該人員的行為類別相同;S2、利用訓(xùn)練集對當(dāng)前的模型進(jìn)行一次或多次訓(xùn)練,每次訓(xùn)練時基于預(yù)定的損失函數(shù)更新模型的參數(shù),該損失函數(shù)被配置為:懲罰源域的樣本的分類偏差、懲罰源域和目標(biāo)域的樣本的樣本特征間的邊緣分布差異和條件分布差異以及懲罰每個樣本對中兩個樣本對應(yīng)的時序分布差異。對應(yīng)的時序分布差異。對應(yīng)的時序分布差異。

    【技術(shù)實現(xiàn)步驟摘要】
    一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法


    [0001]本專利技術(shù)涉及健康大數(shù)據(jù)、遷移學(xué)習(xí)領(lǐng)域,具體來說,涉及一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法。

    技術(shù)介紹

    [0002]由于傳感器體積小、功耗低、攜帶方便、數(shù)據(jù)所需存儲空間小等優(yōu)點,其被廣泛應(yīng)用于行為識別領(lǐng)域中。以帕金森震顫識別為例,被試者可以使用生活中常見的智能手機或手環(huán)(或者任何帶有加速計和陀螺儀的電子設(shè)備)收集自身的姿勢性震顫和靜止性震顫數(shù)據(jù),隨后根據(jù)震顫幅度來診斷被試者的患病程度,這將極大的節(jié)省被試者和醫(yī)生的時間成本。
    [0003]然而,傳感器數(shù)據(jù)集普遍面臨著標(biāo)定數(shù)據(jù)少且數(shù)據(jù)集質(zhì)量不高的問題。與圖片、音頻、文字等可以很方便在采集數(shù)據(jù)后再進(jìn)行標(biāo)注的數(shù)據(jù)形式不同,對于人類來說,傳感器數(shù)據(jù)往往是難以直接理解的,這使得傳感器數(shù)據(jù)在數(shù)據(jù)采集后存在標(biāo)定困難,大量的數(shù)據(jù)是無標(biāo)記的。自遷移學(xué)習(xí)進(jìn)入大眾視野以來,因其可以將從一個領(lǐng)域?qū)W習(xí)到的知識應(yīng)用到另一個新的領(lǐng)域而廣泛應(yīng)用于數(shù)據(jù)標(biāo)注缺乏的人體行為識別領(lǐng)域之中。具體來說,它將來自專業(yè)人士標(biāo)注過的數(shù)據(jù)視作源域,而將未標(biāo)注過的數(shù)據(jù)視作目標(biāo)域,通過實例變換、特征提取、尋找子空間等方法來找到源域和目標(biāo)域的相似性,從而將源域?qū)W習(xí)到的模型應(yīng)用于目標(biāo)域。在遷移學(xué)習(xí)中,相似性可以通過度量源域和目標(biāo)域中聯(lián)合概率分布差異來計算。隨著深度學(xué)習(xí)的興起,主流的遷移學(xué)習(xí)算法通過深度神經(jīng)網(wǎng)絡(luò)提取源域和目標(biāo)域的特征,并通過域判別器計算源域和目標(biāo)域之間的邊緣分布差異,以及類判別器來計算不同類別之間的條件分布差異,進(jìn)而使得聯(lián)合概率分布差異盡量小從而提高目標(biāo)域的模型識別精度。
    [0004]與此同時,傳感器數(shù)據(jù)的采集時間一般持續(xù)較長,在數(shù)據(jù)采集期間容易受到干擾。這種干擾可能由傳感器佩戴位置發(fā)生移位產(chǎn)生,也可能傳感器采集對象自身的狀態(tài)發(fā)生了變化,進(jìn)而使得一條初始數(shù)據(jù)在不同時間段的數(shù)據(jù)分布不同,產(chǎn)生了時序分布差異的現(xiàn)象。與隨機分布且僅影響少數(shù)數(shù)據(jù)點的噪聲不同,時序分布差異遵循某種隨著時間變化的分布,其會影響一個時間段內(nèi)大量的數(shù)據(jù)點。同時,由于時序分布差異產(chǎn)生的原因具有不可預(yù)知性,擬合其分布是不可行的,這使得時序分布差異普遍存在于傳感器數(shù)據(jù)集中且難以消除。因此,在對傳感器時序數(shù)據(jù)進(jìn)行遷移學(xué)習(xí)時,基于現(xiàn)有的遷移學(xué)習(xí)方法均難以取得像在對圖像數(shù)據(jù)集上進(jìn)行遷移學(xué)習(xí)一樣良好的效果。

    技術(shù)實現(xiàn)思路

    [0005]因此,本專利技術(shù)的目的在于克服上述現(xiàn)有技術(shù)的缺陷,提供一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法。
    [0006]本專利技術(shù)的目的是通過以下技術(shù)方案實現(xiàn)的:
    [0007]根據(jù)本專利技術(shù)的第一方面,提供一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法,所述模型包括用于從樣本提取樣本特征的特征提取器和根據(jù)樣本特征對樣本進(jìn)行分
    類的分類器,所述方法包括利用源域中的樣本以及標(biāo)簽對模型進(jìn)行訓(xùn)練以得到初始的模型,并在初始的模型的基礎(chǔ)上按照以下方式進(jìn)行一輪或者多輪迭代訓(xùn)練:S1、獲取訓(xùn)練集,包括基于源域的樣本生成的源域的樣本對以及目標(biāo)域的樣本生成的目標(biāo)域的樣本對,其中任意樣本對包括兩個樣本,每個樣本為對人員采集的傳感器數(shù)據(jù),兩個樣本所對應(yīng)的人員以及被采集時該人員的行為類別相同,但兩個樣本被采集的時間不同,該訓(xùn)練集中為源域的每個樣本設(shè)有指示其被采集時對應(yīng)人員的行為類別的標(biāo)簽;S2、利用訓(xùn)練集對當(dāng)前的模型進(jìn)行一次或者多次訓(xùn)練,每次訓(xùn)練時基于預(yù)定的損失函數(shù)更新該模型的參數(shù),所述損失函數(shù)被配置為:懲罰源域的樣本的分類偏差、懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的邊緣分布差異和條件分布差異以及懲罰源域和目標(biāo)域的樣本對中兩個樣本對應(yīng)的時序分布差異,時序分布差異與分類器對樣本對中兩個樣本分類的置信概率向量的相似度相關(guān)。
    [0008]在本專利技術(shù)的一些實施例中,時序分布差異按照以下方式確定:利用分類器根據(jù)樣本的樣本特征獲取該樣本在每種類別的置信概率并拼接成該樣本對應(yīng)的置信概率向量;根據(jù)樣本對中兩個樣本對應(yīng)的置信概率向量計算相似度,并根據(jù)一次訓(xùn)練時采用的所有樣本對中兩個樣本對應(yīng)的相似度確定時序分布差異。
    [0009]在本專利技術(shù)的一些實施例中,在一次訓(xùn)練時,時序分布差異計算方式如下:
    [0010][0011]其中,m
    s
    表示進(jìn)行一次訓(xùn)練時采用的源域的樣本對總數(shù),x
    si
    表示源域的第i個樣本對,表示源域的第i個樣本對x
    si
    中一個樣本,表示源域的第i個樣本對x
    si
    中另一個樣本,sim(
    ·
    )表示余弦相似度,C(
    ·
    )表示分類器輸出的針對每種類別的置信概率,F(xiàn)(
    ·
    )表示特征提取器的輸出,m
    t
    表示進(jìn)行一次訓(xùn)練時采用的目標(biāo)域的樣本對總數(shù),x
    ti
    表示目標(biāo)域的第i個樣本對,表示目標(biāo)域的第i個樣本對x
    ti
    中一個樣本,表示目標(biāo)域中第i個樣本對x
    ti
    中另一個樣本。
    [0012]在本專利技術(shù)的一些實施例中,所述懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的條件分布差異,包括:根據(jù)每次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本的樣本特征、源域中所有樣本的標(biāo)簽和目標(biāo)域中所有樣本的偽標(biāo)簽,確定源域和目標(biāo)域的所有樣本之間的條件分布差異,其中,所述偽標(biāo)簽為利用當(dāng)前的模型對目標(biāo)域中的樣本進(jìn)行分類得到的分類結(jié)果。
    [0013]在本專利技術(shù)的一些實施例中,在一次訓(xùn)練時,條件分布差異的計算方式如下:
    [0014][0015]其中,G
    c
    表示進(jìn)行一次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本間的條件分布差異,K表示類別的總數(shù)量,k表示第k個類別,表示在希爾伯特空間下距離的平方,n
    s

    示進(jìn)行一次訓(xùn)練時源域的樣本總數(shù),示進(jìn)行一次訓(xùn)練時源域的樣本總數(shù),示進(jìn)行一次訓(xùn)練時源域的樣本總數(shù),表示源域中第k個類別的權(quán)重,表示源域中屬于第k個類別的樣本總數(shù),φ(
    ·
    )表示一種特征映射方法,F(xiàn)(
    ·
    )表示特征提取器的輸出,表示源域的第i個樣本,n
    t
    表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示目標(biāo)域中第k個類別的權(quán)重,表示目標(biāo)域中屬于第k個類別的樣本總數(shù),表示目標(biāo)域的第i個樣本的偽標(biāo)簽,表示目標(biāo)域的第i個樣本。
    [0016]在本專利技術(shù)的一些實施例中,所述基于預(yù)定的損失函數(shù)更新該模型的參數(shù)包括:基于預(yù)定的損失函數(shù)計算得到的總損失更新該模型的參數(shù),其中,在一次訓(xùn)練時,總損失的計算方式如下:
    [0017][0018]其中,J(
    ·
    )表示進(jìn)行一次訓(xùn)練時源域的樣本的分類偏差,C(
    ·
    )表示分類器輸出的針對每種類別的置信概率,F(xiàn)(
    ·
    )表示特征提取器的輸出,x
    s
    表示源域中的樣本,y
    s
    表示源域的樣本的標(biāo)簽,α表示邊緣分布差異對應(yīng)的權(quán)重數(shù)值,G
    m
    本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點】

    【技術(shù)特征摘要】
    1.一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法,其特征在于,所述模型包括用于從樣本提取樣本特征的特征提取器和根據(jù)樣本特征對樣本進(jìn)行分類的分類器,所述方法包括利用源域中的樣本以及標(biāo)簽對模型進(jìn)行訓(xùn)練以得到初始的模型,并在初始的模型的基礎(chǔ)上按照以下方式進(jìn)行一輪或者多輪迭代訓(xùn)練:S1、獲取訓(xùn)練集,包括基于源域的樣本生成的源域的樣本對以及目標(biāo)域的樣本生成的目標(biāo)域的樣本對,其中任意樣本對包括兩個樣本,每個樣本為對人員采集的傳感器數(shù)據(jù),兩個樣本所對應(yīng)的人員以及被采集時該人員的行為類別相同,但兩個樣本被采集的時間不同,該訓(xùn)練集中為源域的每個樣本設(shè)有指示其被采集時對應(yīng)人員的行為類別的標(biāo)簽;S2、利用訓(xùn)練集對當(dāng)前的模型進(jìn)行一次或者多次訓(xùn)練,每次訓(xùn)練時基于預(yù)定的損失函數(shù)更新該模型的參數(shù),所述損失函數(shù)被配置為:懲罰源域的樣本的分類偏差、懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的邊緣分布差異和條件分布差異以及懲罰源域和目標(biāo)域的樣本對中兩個樣本對應(yīng)的時序分布差異,時序分布差異與分類器對樣本對中兩個樣本分類的置信概率向量的相似度相關(guān)。2.根據(jù)權(quán)利要求1所述的訓(xùn)練方法,其特征在于,時序分布差異按照以下方式確定:利用分類器根據(jù)樣本的樣本特征獲取該樣本在每種類別的置信概率并拼接成該樣本對應(yīng)的置信概率向量;根據(jù)樣本對中兩個樣本對應(yīng)的置信概率向量計算相似度,并根據(jù)一次訓(xùn)練時采用的所有樣本對中兩個樣本對應(yīng)的相似度確定時序分布差異。3.根據(jù)權(quán)利要求1或2所述的訓(xùn)練方法,其特征在于,在一次訓(xùn)練時,時序分布差異計算方式如下:其中,m
    s
    表示進(jìn)行一次訓(xùn)練時采用的源域的樣本對總數(shù),x
    si
    表示源域的第i個樣本對,表示源域的第i個樣本對x
    si
    中一個樣本,表示源域的第i個樣本對x
    si
    中另一個樣本,sim(
    ·
    )表示余弦相似度,C(
    ·
    )表示分類器輸出的針對每種類別的置信概率,F(xiàn)(
    ·
    )表示特征提取器的輸出,m
    t
    表示進(jìn)行一次訓(xùn)練時采用的目標(biāo)域的樣本對總數(shù),x
    ti
    表示目標(biāo)域的第i個樣本對,表示目標(biāo)域的第i個樣本對x
    ti
    中一個樣本,表示目標(biāo)域中第i個樣本對x
    ti
    中另一個樣本。4.根據(jù)權(quán)利要求1所述的訓(xùn)練方法,其特征在于,所述懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的條件分布差異,包括:根據(jù)每次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本的樣本特征、源域中所有樣本的標(biāo)簽和目標(biāo)域中所有樣本的偽標(biāo)簽,確定源域和目標(biāo)域的所有樣本之間的條件分布差異,其中,所述偽標(biāo)簽為利用當(dāng)前的模型對目標(biāo)域中的樣本進(jìn)行分類得到的分類結(jié)果。5.根據(jù)權(quán)利要求4所述的訓(xùn)練方法,其特征在于,在一次訓(xùn)練時,條件分布差異的計算方式如下:
    其中,G
    c
    表示進(jìn)行一次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本間的條件分布差異,K表示類別的總數(shù)量,k表示第k個類別,表示在希爾伯特空間下距離的平方,n
    s
    表示進(jìn)行一次訓(xùn)練時源域的樣本總數(shù),次訓(xùn)練時源域的樣本總數(shù),次訓(xùn)練時源域的樣本總數(shù),表示源域中第k個類別的權(quán)重,表示源域中屬于第k個類別的樣本總數(shù),φ(
    ·
    )表示一種特征映射方法,F(xiàn)(
    ·
    )表示特征提取器的輸出,表示源域的第i個樣本,n
    t
    表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示目標(biāo)域中第k個類別的權(quán)重,表示目標(biāo)域中屬于第k個類別的樣本總數(shù),表示目標(biāo)域的第i個樣本的偽標(biāo)簽,表示目...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:陳益強文世杰谷洋馬媛郭帥秦欣
    申請(專利權(quán))人:中國科學(xué)院計算技術(shù)研究所
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码成人网站在线观看| 久久人妻无码一区二区| 亚洲av无码专区在线| 久久国产亚洲精品无码| 免费无码又爽又黄又刺激网站| 日韩av无码免费播放| 亚洲av极品无码专区在线观看| 国产成人无码aa精品一区| 日韩精品中文字幕无码一区| 狠狠躁天天躁中文字幕无码| 无码无套少妇毛多69XXX| 亚欧免费无码aⅴ在线观看| 亚洲av无码专区在线观看素人| 精品人妻系列无码一区二区三区| 国产亚洲精久久久久久无码77777| 亚洲欧洲免费无码| 免费无码毛片一区二区APP| 亚洲精品色午夜无码专区日韩 | av无码东京热亚洲男人的天堂| 国99精品无码一区二区三区| 尤物永久免费AV无码网站| 永久免费av无码不卡在线观看| 久久久久久AV无码免费网站| 成在人线av无码免费高潮喷水| 日韩视频无码日韩视频又2021| 精品国产性色无码AV网站 | 无码午夜成人1000部免费视频| 亚洲人成影院在线无码观看 | 亚洲av福利无码无一区二区 | 亚洲自偷自偷偷色无码中文| 亚洲AV无码乱码在线观看性色扶| 色综合99久久久无码国产精品| 亚洲中文字幕久久无码| 一区二区无码免费视频网站| 欲色aV无码一区二区人妻| 一本色道无码道DVD在线观看 | 中文字幕久久久人妻无码| 成人免费午夜无码视频| 色情无码WWW视频无码区小黄鸭| 亚洲AV无码成人精品区蜜桃 | 中文字幕无码无码专区|