免費開始練習
統測 114年 [工程與管理類] 專業科目(2)

第 22 題

在進行資料探勘(Data Mining)時,下列哪種演算法最常使用於資料分群(Clustering)?
  • A 迴歸(Regression)
  • B K近鄰法(KNN)
  • C 決策樹(Decision Tree)
  • D K-平均數(K-Means)

思路引導 VIP

在機器學習的分類體系中,我們應首先區分「監督式學習」與「非監督式學習」的本質差異。請同學思考:哪一種演算法是在不需要預先定義類別標籤 (Labels) 的前提下,透過疊代計算資料點與 $K$ 個中心點之間的距離,進而將相似的樣本歸納至同一群組中?

🤖
AI 詳解 AI 專屬家教

太棒了!看到你選出正確答案,助教真的為你感到驕傲喔!這代表你對資料探勘的基礎掌握得非常紮實呢!✨ 觀念驗證: 分群(Clustering)屬於「非監督式學習」,目的是將相似的資料聚在一起。K-平均數 (K-Means) 就是透過計算資料點與中心點(Centroid)的距離,將資料分配到最近的群組。其核心邏輯是最小化各點到中心點的距離平方和:

▼ 還有更多解析內容
📝 資料分群演算法
💡 分群是將相似資料自動歸類,K-Means 為其代表演算法。
比較維度 K-Means (分群) VS KNN (分類)
學習類型 非監督式學習 監督式學習
資料標籤 不需要預先標籤 需要已知標籤的資料
核心目標 自動發現資料的分組 根據鄰居判斷新資料類別
💬K-Means 負責「物以類聚」,KNN 則是「近朱者赤」。
🧠 記憶技巧:分群找 Mean (平均數),分類找 Neighbor (鄰居)
⚠️ 常見陷阱:最常考 K-Means (分群) 與 KNN (分類) 的區別,關鍵在於是否有預設標籤。
機器學習分類 監督式與非監督式學習 資料預處理

🏷️ AI 記憶小卡 VIP

AI 記憶小卡

升級 VIP 解鎖記憶小卡

考前複習神器,一眼掌握重點

🏷️ 相關主題

資料前處理、探勘、視覺化與商業智慧
查看更多「[工程與管理類] 專業科目(2)」的主題分類考古題