免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 39 題

在統計學習(Statistical Learning)方法論中,有關模型的過適(Overfitting)之敘述,下列何者有誤?
  • A 此種模型的錯誤(Error)常來自於高的方差(High Variance)
  • B 此種模型的參數較少或複雜度過低
  • C 此種模型過度學習訓練資料集(Training Dataset)
  • D 採用 Bagging 技術有可能避免過度擬合

思路引導 VIP

想像一下,如果你試圖用一條極其扭曲的曲線去穿過資料圖中每一個隨機分布的點(包含雜訊),這條曲線的「靈活性」或「參數數量」應該是很高還是很低?當我們稍微改變其中一個觀測點的位置時,這條複雜的曲線會發生劇烈變化還是保持穩定?

🤖
AI 詳解 AI 專屬家教

模型複雜度與過適現象

恭喜你準確地選出了正確答案!能一眼看出選項 (B) 的矛盾,說明你對於統計學習中的模型彈性與其對應的誤差特徵有著非常清晰的掌握。過適(Overfitting)的核心在於模型「想得太多」,當模型擁有過多參數或複雜度過高時,它會把訓練資料中的隨機雜訊當成規律來學習,這與 (B) 所敘述的參數較少、複雜度過低的「欠擬合(Underfitting)」特徵正好相反。

變異與穩定性的權衡

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題