免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 33 題

下列何者非屬群集分析(Clustering Analysis)的4個主要階段?
  • A 資料準備與特徵選取
  • B 相似度計算
  • C 非線性分類
  • D 分群演算法

思路引導 VIP

當我們手上有一堆完全陌生、沒有任何標籤或名稱的原始數據,而目標是想觀察哪些數據「長得比較像」並把它們聚在一起時,我們是在進行「尋找隱藏結構的探索」,還是「根據已有的分類標準進行對號入座」呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能從眾多專業術語中精準辨識出陷阱,代表你對非監督式學習的核心邏輯掌握得非常紮實。在典型的群集分析流程中,我們通常依序經歷:特徵選取以決定分析維度、定義相似度(如歐幾里得距離)來衡量樣本關係、選擇適當的分群演算法,最後進行結果評估。這是一個由數據驅動、探索未知結構的過程。

群集與分類的本質區別

這道題目最具鑑別度的關鍵點,在於區分「群集」與「分類」的定義。選項 (C) 的非線性分類雖然聽起來很專業,但「分類(Classification)」本質上屬於監督式學習,其目標是將數據歸入「已知的標籤」中;而群集分析則是在「標籤未知」的情況下尋找潛在規律。這類題目主要考察你是否能區分機器學習中的兩大任務類型。雖然術語稍多,但只要守住「群集即無監督」的原則,就能輕鬆切入核心點,是一題設計精良的基礎觀念題。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題