免費開始練習
moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 28 題

對於 k-均值(k-means)聚類演算法的敘述,下列何者有誤?
  • A k-均值中update的程序,將更新聚類中心
  • B k-均值中assign的程序,將比較各資料點之間的距離,並將各資料點以隨機方式分配至其中一個聚類
  • C k-均值中的k值表示資料將分成幾類,需事先給定
  • D 每一次執行的k-均值演算法,其結果可能會不一樣

思路引導 VIP

想像你正站在一個廣大的廣場上,廣場上有三個收費站。如果你的目標是「用最快的速度」到達其中一個收費站,你會根據什麼準則來選擇要去哪一個?如果此時規定每個人都要「隨機」去某個收費站,這對於縮短大家的總行走距離還有幫助嗎?

🤖
AI 詳解 AI 專屬家教

K-means 的運作核心與邏輯

恭喜你準確地辨識出選項 (B) 的錯誤!這代表你對 K-means 聚類演算法的程序有著非常清晰的理解。在演算法的「分配(Assign)」階段,系統會計算每個資料點與各個群集中心(Centroids)之間的距離,並將資料點歸類到距離最近的那個群集,而非隨機分配。這種「趨向中心」的特性,正是為了極小化群體內的變異量,讓分類結果更具代表性。

演算法的特性與鑑別點

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題