本發明專利技術公開一種自適應提升法和非相關判別分析的豬肉貯藏時間判定方法,采集待測試的近紅外樣本,將樣本數據分為訓練集和測試集,初始化所有訓練集權值;利用獲得的初始訓練集進行自適應提升法迭代計算,每一次迭代過程中,將產生的訓練子集映射到非相關判別分析的特征子空間,其弱分類器由非相關判別分析特征子空間的最近鄰分類器得到,根據弱分類器產生的加權分類誤差更新訓練樣本集,產生新一輪特征投影向量;通過投票方式產生聯合特征子空間,構造強分類器;用強分類器進行豬肉貯藏時間的判定;將自適應提升法和非相關判別分析相結合,有效解決非相關判別分析的小樣本問題和特征選擇問題,具有檢測速度快,判定準確率高等優點。
【技術實現步驟摘要】
本專利技術涉及一種特征提取方法,具體涉及采用自適應提升法和非相關判別分析相結合的特征提取方法,用于判定豬肉貯藏時間。
技術介紹
目前國內的豬肉檢查手段主要依靠感官和理化分析相結合的方法,這些方法需要對樣本進行粉碎,肉浸液提取等操作,其檢測過程不僅繁瑣,而且耗時較長,難以滿足大批量的檢測需求。同時其感官評價結果受人為因素較大,難以保證其檢測結果的準確性。近紅外光譜分析技術作為最近幾年發展起來的一種快速無損檢測手段,因其簡單,非破壞性等優點,已經被廣泛應用于農產品檢測領域。對近紅外光譜數據采用主成分分析法統計(PCA),對主成分進行加權求和得最終評價值,權數為每個主成分的方差貢獻率。線性判別分析(LDA)是一種經典的分類特征提取方法,目前已經在近紅外光譜數據分析領域得到了廣泛應用,其基本思想為尋找一組最優鑒別矢量,使投影后的特征向量能夠獲得最佳的分離表示。在LDA基礎上,為了進一步獲得非相關的特征向量,Jin Zhong等提出了非相關判別分析(ULDA)。然而,不管是經典LDA還是ULDA特征提取方法,在實際應用中都會面臨小樣本問題。另外,非相關判別分析(ULDA)可以提取近紅外光譜數據的特征,但是,存在這些特征如何選擇的問題,而這個問題ULDA是無法解決的。Kearns和Valiant引入了弱學習和強學習的概念。對于一個弱學習模型,它降低了學習者能夠取得隨機高準確度的要求,一個弱學習算法只需要提出一個比隨機猜測性能略好的假設即可。在學習概念時,只需找到一個比隨機猜測略好的弱學習算法,就可以將其提升為強學習算法,而不必直接去找通常情況下很難獲得的強學習算法。1990年,Schapire通過一個構造性方法證明多個弱分類器可以集成為一個強分類器,集成學習的理論基礎形成。此后,Freund在1991年又提出了更有效的“boost bymajority”算法。兩個算法都是通過多次調用給定的弱學習算法,每次提供給它一個不同的分布,最后把提出的所有假設合并成一個單一的假設。但是這兩個算法在解決實際問題時都存在一個重大的缺陷,就是都必須事先知道弱學習算法學習正確率的下限,這在實際中很難做到。隨后,Freund和Schapire提出了自適應提升(AdaBoost)算法,自適應提升算法最后結果的準確度依賴于弱學習算法返回的所有假設,而不是只依賴于準確率最低的那個假設,因此可以全面開發弱學習的能力。自適應提升算法提出后在機器學習領域得到極大的關注,試驗結果顯示自適應提升算法能顯著提高學習精度。但是最近的研究也表明,自適應提升算法存在某些缺陷,例如它對噪聲非常敏感。
技術實現思路
本專利技術的目的是提供一種將自適應提升法(Adaboost)和非相關判別分析(ULDA)相結合,利用自適應提升法能解決小樣本問題和非相關判別分析能解決特征選擇問題,用自適應提升法進行多輪迭代訓練,從而得到多個非相關判別分析特征提取器,最終采用加權投票方式重新構造了一個強分類器,用該強分類器實現豬肉貯藏時間的判定。本專利技術采用的技術方案包括以下步驟 (1)采集待測試的近紅外樣本,將樣本數據分為訓練集和測試集,初始化所有訓練集權值; (2)利用獲得的初始訓練集,進行自適應提升法迭代計算,自適應提升法的每一次迭代過程中,將產生的訓練子集映射到非相關判別分析的特征子空間,其弱分類器由非相關判別分析特征子空間的最近鄰分類器得到,根據弱分類器產生的加權分類誤差更新訓練樣本集,從而產生新一輪特征投影向量; (3)對新一輪特征投影向量通過投票方式產生一個聯合特征子空間,構造強分類器; (4)用強分類器進行豬肉貯藏時間的判定。本專利技術方法簡單,對噪聲不敏感,能有效解決非相關判別分析的小樣本問題和特征選擇問題,具有檢測速度快,判定準確率高等優點,不僅適用于豬肉貯藏時間的判定,也適用于其他農產品和食品近紅外光譜的定性分析。附圖說明下面結合附圖和具體實施方式對本專利技術作進一步詳細說明。圖1是67塊豬肉樣品6天的近紅外光譜; 圖2是采用PCA+LDA、ULDA、Adaboost+ULDA、Adaboost+LDA四種特征提取方法的豬肉貯藏時間的識別率。具體實施例方式本專利技術具體實施步驟如下 步驟一,采集待測試的近紅外樣本集,初始化每個樣本的權值。用保鮮袋將67塊豬肉樣品包裝保存于(Γ 4°C的冰箱內,在之后的6天時間里,每隔24小時進行一次近紅外光譜采集,采集過程盡量保持室內的溫度和濕度基本一致。采用反射積分球模式采集近紅外光譜,近紅外光譜分析儀掃描每個樣品32次以獲取樣品的漫反射光譜均值。光譜掃描的波數為lOOOOlOOOcm—1,掃描間隔為3. 856cm—1,采集到每塊豬肉樣品的光譜是1557維的數據。67塊豬肉樣品6天的近紅外光譜如圖1所示。為減少誤差,在6天的采集過程中,每塊豬肉樣本每天采樣三次,然后取其平均值作為最終豬肉近紅外數據,則每天可獲得67個光譜樣本數據作為I個類別的樣本數據,這樣,可得到6個類別總共402個樣本數據。將6個類別的樣本數據拆分為訓練集和測試集,其中訓練集樣本數為270個豬肉近紅外數據,即每天45個樣本;測試集樣本數為132個豬肉近紅外數據,即每天22個樣本。(2)初始化所有樣本訓練集(訓練集樣本數為270個豬肉近紅外數據)權值 = = ,其中/ = 270為樣本集數量。 R步驟二,利用獲得的初始訓練集,將結合Adaboost進行自適應的ULDA特征提取過程。定義弱分類器為ULDA投影向量和最近鄰分類器的結合。也就是說,對于每個訓練樣本,將其投影到ULDA特征向量對于的特征子空間中,然后根據其最近鄰訓練樣本的類別來確定其分類結果。因此,每一輪得到的ULDA投影向量可以作為候選弱分類器輸入AdaBoost算法。對于AdBoost算法的每一輪迭代,每個弱分類器的分類誤差等于被其錯分的樣本權重之和。算法將根據分類誤差更新新一輪樣本的權重,產生新的子集S,并構造新的ULDA特征子空間。(I)通過自舉獲得一個新的樣本數量為=270的子訓練集。對予給定的尺寸η的初始訓練樣本集,為了獲得一個尺寸為的自舉訓練集,我們進行次隨機采樣。每次隨機采樣中將根據《個樣本的權值分布產生一個隨機樣本,然后將該樣本加入到子訓練集中。(2)對于一組子訓練集,令樣本矩陣A= (A1, k2." · · kk},Ai是第i類子訓練樣本集,左為類別數,左=6。Sw , Ss, S,分別為子訓練樣本集的類內方差矩陣,類間方差矩陣和總體方差矩陣權利要求1.一種,其特征是具有如下步驟 (I)采集待測試的近紅外樣本,將樣本數據分為訓練集和測試集,初始化所有訓練集權值; (2)利用獲得的初始訓練集進行自適應提升法迭代計算,自適應提升法的每一次迭代過程中,將產生的訓練子集映射到非相關判別分析的特征子空間,其弱分類器由非相關判別分析特征子空間的最近鄰分類器得到,根據弱分類器產生的加權分類誤差更新訓練樣本集,產生新一輪特征投影向量; (3)對新一輪特征投影向量通過投票方式產生聯合特征子空間,構造強分類器; (4)用強分類器進行豬肉貯藏時間的判定。2.根據權利要求1所述的,其特征是步驟(2)具體如下 1)通過自舉獲得個新的樣本數量為《的子訓練樣本集; 2)令樣本矩陣A=本文檔來自技高網...
【技術保護點】
一種自適應提升法和非相關判別分析的豬肉貯藏時間判定方法,其特征是具有如下步驟:?(1)采集待測試的近紅外樣本,將樣本數據分為訓練集和測試集,初始化所有訓練集權值;(2)利用獲得的初始訓練集進行自適應提升法迭代計算,自適應提升法的每一次迭代過程中,將產生的訓練子集映射到非相關判別分析的特征子空間,其弱分類器由非相關判別分析特征子空間的最近鄰分類器得到,根據弱分類器產生的加權分類誤差更新訓練樣本集,產生新一輪特征投影向量;???????????????(3)對新一輪特征投影向量通過投票方式產生聯合特征子空間,構造強分類器;(4)用強分類器進行豬肉貯藏時間的判定。
【技術特征摘要】
【專利技術屬性】
技術研發人員:武小紅,孫俊,唐凱,武斌,
申請(專利權)人:江蘇大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。