問題詳情

二、分類演算法(classification algorithm)是資料探勘中重要的分析方法。針對以下的訓練資料集:9 筆資料 x1, x2, . . . , x9,每筆資料有 4 個屬性(A1, A2, A3, Class),其中AAA3 為特徵屬性(feature),Class 為類別屬性。phpu5RDat現今希望用決策分類樹(decision tree)來學習該資料集的分類規則,其中分類樹內部節點(internal node)屬性以選擇最小的 Gini
(A)值來決定分支,Gini
(A)函數定義如下:phpLwOnRc,t∈ A i =1t 為屬性 A 中的某特定值,p(t)是屬性 A 中值為 t 所出現的資料比率,p(i|t)是在屬性值為 t 時,資料集隸屬於類別 i 的比率,C 為所有類別的個數。分支的停止條件則是當節點資料完全隸屬同一類別時停止,該樹葉節點(leaf node)即是分類結果。請以此訓練資料集和 Gini
(A)屬性決策條件要求,產生一決策分類樹(decision tree),答案中請清楚表達該決策樹的每一內部節點的屬性、分支條件值和該決策點的Gini
(A)值,以及葉節點的分類結果。(25 分)

參考答案

答案:A
難度:簡單0.783784
統計:A(29),B(3),C(3),D(1),E(0)

內容推薦

內容推薦