【技術實現步驟摘要】
本專利技術涉及機器學習領域,具體涉及一種基于總間隔的模糊V-相對間隔學習機算法。
技術介紹
基于統計學習理論和大間隔思想的支持向量機(SVM)[1]及其相關變體是目前實現模式分類的主流方法之一,其通過最大化類間間隔來達到強泛化能力。目前,SVMs在機器學習和模式識別領域得到了廣泛而成功地應用氣V-支持向量分類機(v-SVM)[3]是SVM的一個擴展變體。Sch01kopf等人[3]引入一個新的參數V來控制支持向量數下界和訓練誤差上界,該參數能取代SVM中的參數C。盡管SVMs方法具有較多明顯優勢,但也存在一些問題[4]。針對SVM易出現過擬合問題,Wang等人M提出模糊SVM (FSVM),其基本思想是根據樣本在它所在類別中的相關性,給每個樣本分配不同的隸屬度值,使那些相關度較小的樣本得到的懲罰也相應較輕。當非均衡樣本集中的負樣本的個數遠遠小于正樣本的個數時,SVM會發生類邊界傾斜現象,從而使SVM在非均衡數據集中的應用受到了限制,為了自適應非均衡的訓練集,引文[5]采用不同代價算法,從而降低了虛警率,提高了識別的準確率。最近,針對SVM對數據仿射或伸縮變化敏感問題,Shivaswamy等人[6]從概率和仿射不變性的角度提出一種數據依賴(data-dependent)正則化相對間隔學習機(RMM)(為了區別,本文稱大間隔方法(SVM)中的間隔為絕對間隔)。RMM通過最大化類間間隔的同時最小化類內模式分布散度來實現二類最大分割,其類間分割間隔度量是基于相對于類內數據分布最小化的相對間隔觀。從理論和實驗兩個方面進行分析證實,RMM具有優于大間隔方法(SVM) ...
【技術保護點】
基于總間隔的模糊v?相對間隔學習機算法,其特征在于包含以下步驟:步驟一:在傳統的相對間隔學習機(RMM)中融合FSVM和TM?SVM方法,對這些方法進行集成和擴展;步驟二:訓練樣本根據它們相關度的不同而采用不同的處理方式,對每個訓練數據賦予一個相對重要程度的隸屬度值,指示數據點對所屬類的重要度,數據點的重要度與隸屬度值成正比;步驟三:通過引入參數v,可控制間隔誤差的上界和支持向量的下界,使得基于總間隔的模糊v?相對間隔學習機(TMF?vRMM)具有相較于相對間隔學習機(RMM)更好的泛化學習能力。
【技術特征摘要】
1.于總間隔的模糊V-相對間隔學習機算法,其特征在于包含以下步驟: 步驟一:在傳統的相對間隔學習機(RMM)中融合FSVM和TM-SVM方法,對這些方法進行集成和擴展; 步驟二:訓練樣本根據它們相關度的不同而采用不同的處理方式,對每個訓練數據賦予一個相...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。