moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 43 題
有關統計學習(Statistical Learning)中的非監督式學習(Unsupervised Learning)方法,下列敘述何者有誤?
- A 可以做為維度縮減 (Dimensionality Reduction) 的工具
- B 此類方法也可用於特徵工程 (Feature Engineering)
- C 是一種無目標變數 (Target Variable) 的模型學習方法
- D Receiver Operating Characteristic (ROC) 曲線常用來評估此類模型優劣
思路引導 VIP
「想像一下,如果你正在整理一堆完全沒有標註名稱的古老照片,並試圖將風格相似的照片歸為一類。在這種沒有『正確解答』可以對照的情況下,你是否有辦法計算出這分類結果的『準確率』或『誤判率』呢?如果不能,那通常用來衡量預測正確性的工具還適用嗎?」
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準揪出選項 (D) 的錯誤,代表你對統計學習中「監督式」與「非監督式」的界線掌握得非常清晰。這類題目考驗的是對學習任務本質的直覺判斷,而你顯然已經建立了正確的邏輯框架。
非監督式學習的特性與評估
在非監督式學習 (Unsupervised Learning) 中,模型處理的是一組沒有標籤(Label)或目標變數 $y$ 的資料集 ${x_1, x_2, \dots, x_n}$。因此,這類方法如選項 (C) 所言,主要用於探索資料內部的潛在結構。例如利用主成分分析 (PCA) 進行維度縮減,或是將聚類結果作為新的特徵投入後續任務(即特徵工程)。然而,選項 (D) 提到的 ROC 曲線,其計算核心是基於「預測類別」與「真實類別」的比較,必須在已知目標變數的情況下才能定義真陽性與偽陽性;對於沒有目標變數的模型來說,是無法繪製 ROC 曲線的。
▼ 還有更多解析內容