【技術(shù)實現(xiàn)步驟摘要】
一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法
[0001]本專利技術(shù)涉及健康大數(shù)據(jù)、遷移學(xué)習(xí)領(lǐng)域,具體來說,涉及一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法。
技術(shù)介紹
[0002]由于傳感器體積小、功耗低、攜帶方便、數(shù)據(jù)所需存儲空間小等優(yōu)點,其被廣泛應(yīng)用于行為識別領(lǐng)域中。以帕金森震顫識別為例,被試者可以使用生活中常見的智能手機或手環(huán)(或者任何帶有加速計和陀螺儀的電子設(shè)備)收集自身的姿勢性震顫和靜止性震顫數(shù)據(jù),隨后根據(jù)震顫幅度來診斷被試者的患病程度,這將極大的節(jié)省被試者和醫(yī)生的時間成本。
[0003]然而,傳感器數(shù)據(jù)集普遍面臨著標(biāo)定數(shù)據(jù)少且數(shù)據(jù)集質(zhì)量不高的問題。與圖片、音頻、文字等可以很方便在采集數(shù)據(jù)后再進(jìn)行標(biāo)注的數(shù)據(jù)形式不同,對于人類來說,傳感器數(shù)據(jù)往往是難以直接理解的,這使得傳感器數(shù)據(jù)在數(shù)據(jù)采集后存在標(biāo)定困難,大量的數(shù)據(jù)是無標(biāo)記的。自遷移學(xué)習(xí)進(jìn)入大眾視野以來,因其可以將從一個領(lǐng)域?qū)W習(xí)到的知識應(yīng)用到另一個新的領(lǐng)域而廣泛應(yīng)用于數(shù)據(jù)標(biāo)注缺乏的人體行為識別領(lǐng)域之中。具體來說,它將來自專業(yè)人士標(biāo)注過的數(shù)據(jù)視作源域,而將未標(biāo)注過的數(shù)據(jù)視作目標(biāo)域,通過實例變換、特征提取、尋找子空間等方法來找到源域和目標(biāo)域的相似性,從而將源域?qū)W習(xí)到的模型應(yīng)用于目標(biāo)域。在遷移學(xué)習(xí)中,相似性可以通過度量源域和目標(biāo)域中聯(lián)合概率分布差異來計算。隨著深度學(xué)習(xí)的興起,主流的遷移學(xué)習(xí)算法通過深度神經(jīng)網(wǎng)絡(luò)提取源域和目標(biāo)域的特征,并通過域判別器計算源域和目標(biāo)域之間的邊緣分布差異,以及類判別器來計算不同類別之間的條件分布差異,進(jìn)而使得聯(lián)合概率分布差 ...
【技術(shù)保護(hù)點】
【技術(shù)特征摘要】
1.一種用于識別人體行為的神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練方法,其特征在于,所述模型包括用于從樣本提取樣本特征的特征提取器和根據(jù)樣本特征對樣本進(jìn)行分類的分類器,所述方法包括利用源域中的樣本以及標(biāo)簽對模型進(jìn)行訓(xùn)練以得到初始的模型,并在初始的模型的基礎(chǔ)上按照以下方式進(jìn)行一輪或者多輪迭代訓(xùn)練:S1、獲取訓(xùn)練集,包括基于源域的樣本生成的源域的樣本對以及目標(biāo)域的樣本生成的目標(biāo)域的樣本對,其中任意樣本對包括兩個樣本,每個樣本為對人員采集的傳感器數(shù)據(jù),兩個樣本所對應(yīng)的人員以及被采集時該人員的行為類別相同,但兩個樣本被采集的時間不同,該訓(xùn)練集中為源域的每個樣本設(shè)有指示其被采集時對應(yīng)人員的行為類別的標(biāo)簽;S2、利用訓(xùn)練集對當(dāng)前的模型進(jìn)行一次或者多次訓(xùn)練,每次訓(xùn)練時基于預(yù)定的損失函數(shù)更新該模型的參數(shù),所述損失函數(shù)被配置為:懲罰源域的樣本的分類偏差、懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的邊緣分布差異和條件分布差異以及懲罰源域和目標(biāo)域的樣本對中兩個樣本對應(yīng)的時序分布差異,時序分布差異與分類器對樣本對中兩個樣本分類的置信概率向量的相似度相關(guān)。2.根據(jù)權(quán)利要求1所述的訓(xùn)練方法,其特征在于,時序分布差異按照以下方式確定:利用分類器根據(jù)樣本的樣本特征獲取該樣本在每種類別的置信概率并拼接成該樣本對應(yīng)的置信概率向量;根據(jù)樣本對中兩個樣本對應(yīng)的置信概率向量計算相似度,并根據(jù)一次訓(xùn)練時采用的所有樣本對中兩個樣本對應(yīng)的相似度確定時序分布差異。3.根據(jù)權(quán)利要求1或2所述的訓(xùn)練方法,其特征在于,在一次訓(xùn)練時,時序分布差異計算方式如下:其中,m
s
表示進(jìn)行一次訓(xùn)練時采用的源域的樣本對總數(shù),x
si
表示源域的第i個樣本對,表示源域的第i個樣本對x
si
中一個樣本,表示源域的第i個樣本對x
si
中另一個樣本,sim(
·
)表示余弦相似度,C(
·
)表示分類器輸出的針對每種類別的置信概率,F(xiàn)(
·
)表示特征提取器的輸出,m
t
表示進(jìn)行一次訓(xùn)練時采用的目標(biāo)域的樣本對總數(shù),x
ti
表示目標(biāo)域的第i個樣本對,表示目標(biāo)域的第i個樣本對x
ti
中一個樣本,表示目標(biāo)域中第i個樣本對x
ti
中另一個樣本。4.根據(jù)權(quán)利要求1所述的訓(xùn)練方法,其特征在于,所述懲罰源域和目標(biāo)域的樣本對應(yīng)的樣本特征間的條件分布差異,包括:根據(jù)每次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本的樣本特征、源域中所有樣本的標(biāo)簽和目標(biāo)域中所有樣本的偽標(biāo)簽,確定源域和目標(biāo)域的所有樣本之間的條件分布差異,其中,所述偽標(biāo)簽為利用當(dāng)前的模型對目標(biāo)域中的樣本進(jìn)行分類得到的分類結(jié)果。5.根據(jù)權(quán)利要求4所述的訓(xùn)練方法,其特征在于,在一次訓(xùn)練時,條件分布差異的計算方式如下:
其中,G
c
表示進(jìn)行一次訓(xùn)練時采用的源域和目標(biāo)域的所有樣本間的條件分布差異,K表示類別的總數(shù)量,k表示第k個類別,表示在希爾伯特空間下距離的平方,n
s
表示進(jìn)行一次訓(xùn)練時源域的樣本總數(shù),次訓(xùn)練時源域的樣本總數(shù),次訓(xùn)練時源域的樣本總數(shù),表示源域中第k個類別的權(quán)重,表示源域中屬于第k個類別的樣本總數(shù),φ(
·
)表示一種特征映射方法,F(xiàn)(
·
)表示特征提取器的輸出,表示源域的第i個樣本,n
t
表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示進(jìn)行一次訓(xùn)練時目標(biāo)域的樣本總數(shù),表示目標(biāo)域中第k個類別的權(quán)重,表示目標(biāo)域中屬于第k個類別的樣本總數(shù),表示目標(biāo)域的第i個樣本的偽標(biāo)簽,表示目...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳益強,文世杰,谷洋,馬媛,郭帥,秦欣,
申請(專利權(quán))人:中國科學(xué)院計算技術(shù)研究所,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。