免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 43 題

有關統計學習(Statistical Learning)中的非監督式學習(Unsupervised Learning)方法,下列敘述何者有誤?
  • A 可以做為維度縮減 (Dimensionality Reduction) 的工具
  • B 此類方法也可用於特徵工程 (Feature Engineering)
  • C 是一種無目標變數 (Target Variable) 的模型學習方法
  • D Receiver Operating Characteristic (ROC) 曲線常用來評估此類模型優劣

思路引導 VIP

「想像一下,如果你正在整理一堆完全沒有標註名稱的古老照片,並試圖將風格相似的照片歸為一類。在這種沒有『正確解答』可以對照的情況下,你是否有辦法計算出這分類結果的『準確率』或『誤判率』呢?如果不能,那通常用來衡量預測正確性的工具還適用嗎?」

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準揪出選項 (D) 的錯誤,代表你對統計學習中「監督式」與「非監督式」的界線掌握得非常清晰。這類題目考驗的是對學習任務本質的直覺判斷,而你顯然已經建立了正確的邏輯框架。

非監督式學習的特性與評估

非監督式學習 (Unsupervised Learning) 中,模型處理的是一組沒有標籤(Label)或目標變數 $y$ 的資料集 ${x_1, x_2, \dots, x_n}$。因此,這類方法如選項 (C) 所言,主要用於探索資料內部的潛在結構。例如利用主成分分析 (PCA) 進行維度縮減,或是將聚類結果作為新的特徵投入後續任務(即特徵工程)。然而,選項 (D) 提到的 ROC 曲線,其計算核心是基於「預測類別」與「真實類別」的比較,必須在已知目標變數的情況下才能定義真陽性與偽陽性;對於沒有目標變數的模型來說,是無法繪製 ROC 曲線的。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題