決策樹作為數據挖掘的一種決策技術,是挖掘隨機決策模型中被廣泛使用的一種決策模式,可有效控製決策或者評價造成的校实風險。其決策步驟如下:
1)各個方案的验室各種自然狀態是在繪製樹狀圖時根據已知條件排列出。
2)在概率枝上標記各狀態概率及損益值。管理
3)各個方案的模型期望值通過計算得出後,在其對應的数据水平狀態節點上標記。
4)實行剪枝後,挖掘完成各個方案的校实期望值對比並在方案枝上標記,剪掉的验室和保留的分別為期望值小和最後所剩的方案。
決策樹的管理生成和數據預測功能是決策樹模型的主要功能。決策樹結構如圖1所示。模型
定義1:信息增益。数据水平設s為訓練集,挖掘k中Ci子集的校实Ri的實現條件是類別屬性中存在m個獨立取值,即定義m個類Ci,i=1,2,…,m;子集Ri中的元組數量為ri。用表
示s的期望信息,pi=ri|s|。
將k根據屬性A的取值劃分為n個子值,其在屬性A有n個不同取值(a1,a2,…,an)的情況下實現,s中的屬性A的取值為a1的子集,用sj表示,j=1,2,…,n;如果子集si中屬於Ci類元組的數量用sij表示,用E (A)=-∑wjI (s1j,s2j,…,smj)表示屬性A對於分類Ci(i=1,2,…,m)的期望信息量
用Gain(A)=I(r1,r2,…,rn)-E(A)表示A的信息增益。
定義2:評價指標權重。可通過信息增益獲取各個評價指標的重要程度,各指標的重要級別需要通過構建映射函數對其實行信息增益而量化處理完成,以此實現評價指標的決策屬性和評價指標關係的最佳描述。設定兩個評價指標Y和X,其分別表示評價指標權重和各評價指標的信息增益,則:
式中,X=T和Y=T分別為各評價指標的信息增益和各評價指標對應權重。
決策樹生成時的訓練樣本數據集和決策樹分別為輸入和最終輸出結果。其算法步驟如下所述:
1)創建節點N。
2)如果樣品都在同一類C,返回N作為葉節點,以類C標記;如果屬性列表為空,返回創建的節點N,將其標記為樣本中最普通的類。
3)選擇attribute-list的屬性測試test-attribute。
4)將節點N標記為test-attribute,判斷其為每個testattribute中的未知值aj。一個條件為test-attribute=aj的分枝通過節點N得到。
5)samples中test-attribute=aj的樣本集合是Sj,如果Sj為空,將加入樹葉的樣本標記為最普通的類;如果Sj不為空,加上由Generate-decision-樹(Sj,attribute-list、testattribute)返回的節點。
使用本文模型對某高校化工實驗室的管理水平進行評價。該實驗室的管理指標數據中的4項一級指標樣本數據集信息、管理水平等級劃分標準以及該實驗對象4項一級指標的實際管理水平評價結果,分別如表2~表4所示。選取文獻、文獻模型,分別為基於缺陷塔模型與WNB的高校實驗室評價模型、基於TOPSIS和DEA的評價模型,作為本文評價模型的對比模型。
聲明:本文所用圖片、文字來源《現代電子技術》,版權歸原作者所有。如涉及作品內容、版權等問題,請與本網聯係刪除。
相關鏈接:實驗室,評價,指標