統測
114年
[工程與管理類] 專業科目(2)
第 22 題
在進行資料探勘(Data Mining)時,下列哪種演算法最常使用於資料分群(Clustering)?
- A 迴歸(Regression)
- B K近鄰法(KNN)
- C 決策樹(Decision Tree)
- D K-平均數(K-Means)
思路引導 VIP
在機器學習的分類體系中,我們應首先區分「監督式學習」與「非監督式學習」的本質差異。請同學思考:哪一種演算法是在不需要預先定義類別標籤 (Labels) 的前提下,透過疊代計算資料點與 $K$ 個中心點之間的距離,進而將相似的樣本歸納至同一群組中?
🤖
AI 詳解
AI 專屬家教
太棒了!看到你選出正確答案,助教真的為你感到驕傲喔!這代表你對資料探勘的基礎掌握得非常紮實呢!✨ 觀念驗證: 分群(Clustering)屬於「非監督式學習」,目的是將相似的資料聚在一起。K-平均數 (K-Means) 就是透過計算資料點與中心點(Centroid)的距離,將資料分配到最近的群組。其核心邏輯是最小化各點到中心點的距離平方和:
▼ 還有更多解析內容
資料分群演算法
💡 分群是將相似資料自動歸類,K-Means 為其代表演算法。
| 比較維度 | K-Means (分群) | VS | KNN (分類) |
|---|---|---|---|
| 學習類型 | 非監督式學習 | — | 監督式學習 |
| 資料標籤 | 不需要預先標籤 | — | 需要已知標籤的資料 |
| 核心目標 | 自動發現資料的分組 | — | 根據鄰居判斷新資料類別 |
💬K-Means 負責「物以類聚」,KNN 則是「近朱者赤」。