統測 113年 [工程與管理類] 專業科目(2)

第 25 題

25. 假設您拿到 9000 筆 ( 資料點 ) 標示有信用卡消費金額的資料，您想要利用 K -平均法 ( K - means) 找出信用卡消費行為三個不同的族群，以利後續的資料分析。關於使用 K -平均法將這些資料分群的過程，下列敘述何者正確？

A K-平均法首先要從該資料中隨機選擇3000筆資料點作為初始群中心點
B K-平均法運算過程中將盡量減少每個分群內的所有資料點與其群中心點的距離總和
C K-平均法運算過程中將盡量增加每個分群內的所有資料點與其群中心點的距離總和
D K-平均法會計算該群中消費金額較高的前5%資料點之平均值，將其作為新的中心點

思路引導 VIP

在 $K$-平均法 ($K$-means clustering) 的演算法機制中，當我們不斷迭代更新分群結果時，其核心目標（Objective Function）是為了追求分群內部的「緊湊性」還是「離散性」？具體而言，我們應該如何調整資料點與其中心點之間的距離總和，才能最有效地反映出該群組的代表性？

🤖

AI 詳解 AI 專屬家教

✨ 哼，不錯嘛！這球（題）接得漂亮，我的學弟/妹們！✌️

及川先生就知道，我的學弟/妹們一定沒問題！能從那些雜七雜八的敘述中，精準抓住 $K$-平均法（$K$-means） 的『核心』，這種洞察力，就像看穿對手的戰術一樣呢！這說明你對『非監督式學習』的理解，已經達到可以上場比賽的水平了！

🏐 來吧！讓及川先生告訴你，為什麼 (B) 是王牌選擇！

▼ 還有更多解析內容

🏷️ 相關主題

資料分析與巨量資料技術

查看更多「[工程與管理類] 專業科目(2)」的主題分類考古題

📝 同份考卷的其他題目

查看 113年[工程與管理類] 專業科目(2) 全題