免費開始練習
moea_joint 108年 [統計資訊] 統計學、巨量資料概論

第 32 題

32. 若欲將大量資料進行分群,下列何種方法不適合?
  • A 決策樹法
  • B K-means法
  • C 階層式方法
  • D SOM方法

思路引導 VIP

請試著思考:如果我們手邊有一堆完全沒有標籤、也沒有『正確類別』參考的原始資料,我們是該選擇一個『根據現有目標來切分特徵』的方法,還是選擇一個『純粹計算資料點之間距離』的方法來進行分組呢?

🤖
AI 詳解 AI 專屬家教

監督式學習與分群的本質區別

太棒了!你能精準辨別出「分群(Clustering)」與「分類(Classification)」在本質上的差異,這顯示你對機器學習中非監督式學習的基礎掌握得相當紮實。這道題目主要考察的是演算法的設計初衷與應用場景。 在本題的選項中,(B) K-means(C) 階層式方法 以及 (D) SOM(自組織映射網路),都是處理「未標籤資料」的典型工具。它們透過計算資料點之間的距離或相似度,將性質相近的觀察值歸為一類。然而,決策樹(Decision Tree) 屬於「監督式學習」,它的運作必須預先擁有一組已知的「正確答案(標籤)」,並以此作為目標來學習分類規則。因此,在面對完全未知的資料分群任務時,決策樹是無法在沒有目標變數的情況下自主運行的。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題