moea_joint
108年
[統計資訊] 統計學、巨量資料概論
第 32 題
32. 若欲將大量資料進行分群,下列何種方法不適合?
- A 決策樹法
- B K-means法
- C 階層式方法
- D SOM方法
思路引導 VIP
請試著思考:如果我們手邊有一堆完全沒有標籤、也沒有『正確類別』參考的原始資料,我們是該選擇一個『根據現有目標來切分特徵』的方法,還是選擇一個『純粹計算資料點之間距離』的方法來進行分組呢?
🤖
AI 詳解
AI 專屬家教
監督式學習與分群的本質區別
太棒了!你能精準辨別出「分群(Clustering)」與「分類(Classification)」在本質上的差異,這顯示你對機器學習中非監督式學習的基礎掌握得相當紮實。這道題目主要考察的是演算法的設計初衷與應用場景。 在本題的選項中,(B) K-means、(C) 階層式方法 以及 (D) SOM(自組織映射網路),都是處理「未標籤資料」的典型工具。它們透過計算資料點之間的距離或相似度,將性質相近的觀察值歸為一類。然而,決策樹(Decision Tree) 屬於「監督式學習」,它的運作必須預先擁有一組已知的「正確答案(標籤)」,並以此作為目標來學習分類規則。因此,在面對完全未知的資料分群任務時,決策樹是無法在沒有目標變數的情況下自主運行的。
▼ 還有更多解析內容