The invention discloses a construction of a random strong classifier method and system, the method comprises the following steps: according to the preset number of weak classifiers to construct n n random weak classifiers; in the original sample are randomly selected as training samples with the same number of original sample data set back; according to the preset random rate randomly selected the sample attribute in the value of training the N weak classifier to get the final prediction category n weak classifiers, a strong classifier for predicting class final prediction category each weak classifier of the voting method.
【技術實現步驟摘要】
一種隨機強分類器的構建方法和系統
本專利技術涉及強分類器
,尤其涉及一種隨機強分類器的構建方法和系統。
技術介紹
決策樹是一個樹結構,其每個非葉節點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節點存放一個類別。使用決策樹進行決策的過程就是從根節點開始,測試待分類項中相應的特征屬性,并按照其值選擇輸出分支,直到到達葉子節點,將葉子節點存放的類別作為決策結果。決策樹的決策過程非常直觀,容易被人理解。目前決策樹已經成功運用于醫學、制造產業、天文學、分支生物學以及商業等諸多領域。決策樹算法有著訓練時間復雜度較低,預測的過程比較快速,模型容易展示等良好的特性;但是單個決策樹容易過擬合。目前,從現有的分類算法中找到一個好的強分類算法比較難,所以需要一種可以把若干個弱分類器整合成一個強分類器的方法,傳統的隨機森林算法是把多個決策樹組合起來,即在變量的使用和數據的使用上進行隨機化,生成很多分類樹,再匯總分類樹的結果,這種算法的弱分類器都相同,弱分類器只有決策樹,處理的方向單一效果不好。
技術實現思路
基于
技術介紹
存在的技術問題,本專利技術提出了一種隨機強分類器的構建方法和系統;本專利技術提出的一種隨機強分類器的構建方法,該方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。其中, ...
【技術保護點】
一種隨機強分類器的構建方法,其特征在于,所述方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。
【技術特征摘要】
1.一種隨機強分類器的構建方法,其特征在于,所述方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。2.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,具體包括:S31、根據預設隨機率隨機選取所述訓練樣本中屬性值;S32、用n個弱分類器分別對所述屬性值加噪聲干擾得到預測類別,將預測類別與訓練樣本的實際類別進行比較,得到每個屬性的重要性分數,根據所述每個屬性的重要性分數得到最終預測類別。3.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,所述用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別,具體包括:獲取所述n個弱分類器的最終預測類別中的眾數,并將所述眾數對應的最終預測類別作為強分類器的預測類別。4.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練過程是并行的,且n個弱分類器之間互不干擾。5.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,還包括步驟S4,獲取測試樣本,對測試樣本進行步驟S3操作,得到強分類器的目標預測類別,將強分類器的目標預測類別與測試樣本的已知類別進行比較對強...
【專利技術屬性】
技術研發人員:馬陽玲,楊周旺,劉利剛,王士瑋,
申請(專利權)人:合肥阿巴賽信息科技有限公司,
類型:發明
國別省市:安徽,34
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。