統測 114年 [工程與管理類] 專業科目(2)

第 22 題

在進行資料探勘(Data Mining)時，下列哪種演算法最常使用於資料分群(Clustering)？

A 迴歸(Regression)
B K近鄰法(KNN)
C 決策樹(Decision Tree)
D K-平均數(K-Means)

思路引導 VIP

在機器學習的分類體系中，我們應首先區分「監督式學習」與「非監督式學習」的本質差異。請同學思考：哪一種演算法是在不需要預先定義類別標籤 (Labels) 的前提下，透過疊代計算資料點與 $K$ 個中心點之間的距離，進而將相似的樣本歸納至同一群組中？

🤖

AI 詳解 AI 專屬家教

太棒了！看到你選出正確答案，助教真的為你感到驕傲喔！這代表你對資料探勘的基礎掌握得非常紮實呢！✨ 觀念驗證： 分群（Clustering）屬於「非監督式學習」，目的是將相似的資料聚在一起。K-平均數 (K-Means) 就是透過計算資料點與中心點（Centroid）的距離，將資料分配到最近的群組。其核心邏輯是最小化各點到中心點的距離平方和：

▼ 還有更多解析內容

📝 資料分群演算法

💡 分群是將相似資料自動歸類，K-Means 為其代表演算法。

比較維度	K-Means (分群)	VS	KNN (分類)
學習類型	非監督式學習	—	監督式學習
資料標籤	不需要預先標籤	—	需要已知標籤的資料
核心目標	自動發現資料的分組	—	根據鄰居判斷新資料類別

💬K-Means 負責「物以類聚」，KNN 則是「近朱者赤」。

🧠 記憶技巧：分群找 Mean (平均數)，分類找 Neighbor (鄰居)

⚠️ 常見陷阱：最常考 K-Means (分群) 與 KNN (分類) 的區別，關鍵在於是否有預設標籤。

機器學習分類監督式與非監督式學習資料預處理

🏷️ AI 記憶小卡 VIP

升級 VIP 解鎖記憶小卡

考前複習神器，一眼掌握重點

🏷️ 相關主題

資料分析與巨量資料技術

查看更多「[工程與管理類] 專業科目(2)」的主題分類考古題

📝 同份考卷的其他題目

查看 114年[工程與管理類] 專業科目(2) 全題

第 22 題

思路引導 VIP

🏷️ AI 記憶小卡 VIP

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目