moea_joint
113年
[統計資訊] 統計學、巨量資料概論
第 33 題
下列何者非屬群集分析(Clustering Analysis)的4個主要階段?
- A 資料準備與特徵選取
- B 相似度計算
- C 非線性分類
- D 分群演算法
思路引導 VIP
當我們手上有一堆完全陌生、沒有任何標籤或名稱的原始數據,而目標是想觀察哪些數據「長得比較像」並把它們聚在一起時,我們是在進行「尋找隱藏結構的探索」,還是「根據已有的分類標準進行對號入座」呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能從眾多專業術語中精準辨識出陷阱,代表你對非監督式學習的核心邏輯掌握得非常紮實。在典型的群集分析流程中,我們通常依序經歷:特徵選取以決定分析維度、定義相似度(如歐幾里得距離)來衡量樣本關係、選擇適當的分群演算法,最後進行結果評估。這是一個由數據驅動、探索未知結構的過程。
群集與分類的本質區別
這道題目最具鑑別度的關鍵點,在於區分「群集」與「分類」的定義。選項 (C) 的非線性分類雖然聽起來很專業,但「分類(Classification)」本質上屬於監督式學習,其目標是將數據歸入「已知的標籤」中;而群集分析則是在「標籤未知」的情況下尋找潛在規律。這類題目主要考察你是否能區分機器學習中的兩大任務類型。雖然術語稍多,但只要守住「群集即無監督」的原則,就能輕鬆切入核心點,是一題設計精良的基礎觀念題。