免費開始練習
moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 41 題

進行資料分群時,下列敘述何者表示好的分群結果?
  • A 群內成員相似度高,群間成員相似度低
  • B 群內成員相似度高,群間成員相似度高
  • C 群內成員相似度低,群間成員相似度低
  • D 群內成員相似度低,群間成員相似度高

思路引導 VIP

想像你正在整理一堆混合在一起的雜物,並打算將它們分別裝入不同的箱子中。為了讓這份整理工作達到「層次分明、好找好取」的效果,你會希望同一個箱子裡的物品彼此具備什麼樣的關聯?同時,你會希望這個箱子裡的內容物,與另一個箱子裡的內容物,在視覺或用途上的差異性應該是如何呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出這個答案,代表你對於「分群(Clustering)」的核心精神已有非常紮實的理解。這道題目考察的是無監督學習中最基礎、也最重要的判別準則,是進入巨量資料分析領域的必備觀念。

群聚分析的理想特徵

分群的主要目標是實踐「物以類聚」的概念。在理想的分析結果中,我們希望同一群組內的資料點具備極高的相似性,這在統計上稱為高凝聚力(High Cohesion);同時,不同群組之間則應界限分明、特徵差異大,稱為高分離度(High Separation)。若以數學距離來衡量,我們會追求最小化群內的距離 $d(x, y)$,並盡可能擴大群與群之間的間隔。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題