【技術實現步驟摘要】
本專利技術涉及特征提取的方法,具體涉及。
技術介紹
在模式識別、信息融合、文本分類、計算視覺和數據挖掘等應用領域,常常會碰到許多高維數據,處理高維數據需要很長的時間和非常大的存儲空間,因此,在進行諸如分類、聚類任務前,需要對高維數據進行降維預處理,常見的兩種降維方法是特征選擇和特征提取。目前,己出現了多種特征選擇方法,如主成分分析、線性鑒別分析等,主成分分析是一種無監督的降維方法,其目的是找出一組正交基,并在該組正交基空間下捕獲數據的全局信息;線性鑒別分析是一種監督的降維方法,其目的通過最大類問散布矩陣和最小類內散布矩陣獲得數據的一個變換子空間。另外,基于流行學習方法,提出了 IS0MAP、拉普拉斯特征映射、局部線性嵌入和局部保持投影等降維方法,ISOMAP和拉普拉斯特征映射屬于非線性算法,而局部線性嵌入和局部保持投影是屬于線性算法。一般來說,基于流行學習的降維方法的核心思想是通過局部不變性來檢測數據潛在的流行結構以便獲得數據的低維表示,另外,這種局部不變性通常使用一個近鄰圖來保證,但什么樣的近鄰圖是合適的、多大才算是局部成為了難題,具體來說,如何選擇合適的近鄰大小來構建近鄰圖以便匹配流行的局部幾何結構成為有效降維的關鍵。
技術實現思路
本專利技術的目的是解決鄰域大小自動選擇的問題,并集成到局部保持投影算法中,使局部保持投影算法能夠自動根據數據集的分布構建近鄰圖,實現有效降維。為實現上述目的,本專利技術提出了,包含如下步驟A)計算每個樣本點Xi的最近鄰點Zi或最近鄰域ε i ;B)找出每個樣本點Xi的最近鄰點N(Xi);C)計算近鄰圖的權矩陣w ;D)計算對 ...
【技術保護點】
一種鄰域自適應的局部保持投影方法,其特征在于:包含如下步驟:A)計算每個樣本點xi的最近鄰點zi或最近鄰域εi;B)找出每個樣本點xi的最近鄰點N(xi);C)計算近鄰圖的權矩陣W,采用0?1權計算近鄰圖的權矩陣W即:D)計算對角矩陣和拉普拉斯矩陣L=D?W;E)計算特征問題XLXTv=λXDXTv的特征值和特征向量,其中F)根據E)步驟中所得的特征值的大小,依次輸出d個最小特征值對應的特征向量V=[v1,Λ,vd];G)根據F)步驟中所得的特征向量V對每個樣本點進行降維,獲得低維數據Y=VTX,其中FDA00002530420000011.jpg,FDA00002530420000012.jpg,FDA00002530420000013.jpg,FDA00002530420000014.jpg
【技術特征摘要】
1.一種鄰域自適應的局部保持投影方法,其特征在于包含如下步驟 A)計算每個樣本點Xi的最近鄰點Zi或最近鄰域εi ; B)找出每個樣本點Xi的最近鄰點N(Xi); C)計算近鄰圖的權矩陣W,采用0-1權計算近鄰圖的權矩陣W即2.如權利要求1所述的一種鄰域自適應的局部保持投影方法,其特征在于所述A)步驟中所計算的是每個樣本點Xi的最近鄰點Zi,3.如權利要求2所述的一種鄰域自適應的局部保持投影方法,其特征在于所述 ka(n)Μχ. )=所述MXi,Xj)是帶寬為σ的核函數。 V. X,4.如權利要求2所述的一種鄰域自適應的局...
【專利技術屬性】
技術研發人員:蔣云良,胡文軍,成新民,王娟,
申請(專利權)人:湖州師范學院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。