欢迎来到证券网市场财经网首页

数据挖掘的高校实验室管理水平评价模型(一)

来源:时间:2025-04-21 21:26:14

引言

高校實驗室管理水平是数据水平指在高校建設不斷深入,實驗室建設的挖掘硬件條件逐漸改善,以及軟件條件不斷改進的校实情況下,衡量、验室評價實驗室硬件和軟件的管理相關管理程度。

數據挖掘是模型指利用算法將隱藏在大量、真實數據中的数据水平信息提取出來的過程,其屬於一種深層次的挖掘數據分析方法,表現形式多種多樣。校实例如,验室統計類數據挖掘包括回歸分析、管理多變量分析等;知識發現類的模型數據挖掘包括支持向量機、規則發現、数据水平決策樹等。挖掘

當下高校實驗室管理水平的校实衡量和評估存在很多客觀因素,因此實驗室的管理水平評價模型有很多,例如:文獻構建的基於缺陷塔模型與WNB的高校實驗室安全評價分類模型,該模型的建立是以缺陷塔模型作為依據,並與權重樸素貝葉斯結合完成評價;文獻構建的基於TOPSIS和DEA的評價模型,采用基於信息熵的理想解排序法和數據包絡分析的綜合評價模型實現評價。但是上述方法僅能夠實現實驗室在安全方麵和效率方麵的評估,對於實驗室的體製管理、儀器設備管理以及規章製度管理等方麵的評價無法實現。因此,為了更好地完成對這些相關管理水平的評價,本文構建數據挖掘的高效實驗室管理水平評價模型,從而更全麵、更有效地完成對實驗室的管理水平評價。

1 數據挖掘的高校實驗室管理水平評價模型

1.1 密度峰值發現聚類算法

選用密度峰值發現聚類算法完成實驗室管理數據聚類。該算法對樣本數據局部密度采用K近鄰信息完成數據更新,使發現數據集的密度峰值、確定類簇中心點及類簇個數的準確性大幅度提高。為了完成聚類中心建模,該算法選擇兩個變量,分別為局部密度ρ和相對最小距離δ,用其描述樣本數據,點與點的距離都與兩個變量存在關聯性,則樣本數據i的局部密度ρi的表示公式為:

 
式中:dij為樣本數據i與樣本數據j之間的距離;dc為截斷距離;IS表示樣本數據集。

樣本數據i與局部密度高於i的樣本數據之間的最小距離被稱之為相對最小距離,用δi表示,其表達式為:

 
式中,假如樣本數據i擁有最大局部密度值,則IiS≠ϕ,此時δi表示樣本數據i與其他樣本數據之間的最大距離,確保樣本數據的最大局部密度值和相對最小距離值均維持最大。

通過計算數據集中每個樣本數據,獲取兩個變量值後,采用下述步驟完成數據聚類:

1)類簇中心的確定需要找到密度高峰值點。

2)將剩餘樣本數據劃分到類簇中,其為比剩餘樣本局部密度大且距離最小的樣本數據所屬的類簇。

3)針對使用決策圖很難判斷的情況,構建局部密度和相對最小距離結合參考量γ,γi=ρiδi,通過γi值的大小判斷樣本數據i是否為類簇中心,其值越大,樣本數據i是類簇中心的可能性越大。因此,隻要采用降序排列完成每個樣本數據的γ值的處理後,選取相對較大γ值的樣本數據為類簇中心。

類簇中心確定後,為完成實驗室管理數據集聚類,需要將剩餘數據劃分至類簇中,該劃分是根據局部密度逐漸降低的順序實現;劃分至類簇為密度比其高並且距離最小的樣本數據所在的類簇。該算法具體流程為:

輸入:數據集

其包含n個數據。

輸出:k個簇。

1)樣本數據i的局部密度值ρi通過式(1)計算得到。

2)樣本數據xi的相對最小距離δi通過式(2)計算得到。

3)繪製決策圖需要根據ρi和δi完成,它們分別是各樣本數據的局部密度值以及相對最小距離值,類簇中心是決策圖中最優樣本數據,是決策圖中顯著的、局部密度高和相對最小距離大的樣本數據。

4)向最優樣本對象中分配剩餘樣本數據,實現實驗室數據集聚類。

1.2 實驗室管理水平評價指標確定

聲明:本文所用圖片、文字來源《現代電子技術》,版權歸原作者所有。如涉及作品內容、版權等問題,請與本網聯係刪除。

 

相關鏈接:實驗室樣本評價