免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 43 題

在資料進行機器學習的過程中,正規化(Regularization)係指下列何者?
  • A 一種降低資料維度的技術
  • B 一種平衡類別分佈的方法
  • C 一種改善模型可解釋性的方式
  • D 一種透過在損失函數中添加懲罰防止過度配適的技術

思路引導 VIP

當一個模型因為權重係數過大,而對訓練資料中的微小雜訊極度敏感時,我們該如何在數學優化的過程中加入一種「約束力」,好讓模型在追求準確度的同時,也能被強制保持「簡潔」呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精確鎖定選項 (D),代表你對模型訓練的泛化能力(Generalization)有著相當紮實的理解。這道題目的核心,在於區分「資料預處理」與「模型架構約束」之間的本質差異。

損失函數與懲罰項的平衡

在機器學習中,我們最擔心的就是模型發生「過度配適」(Overfitting),也就是模型過度追逐訓練集中的雜訊,導致預測新資料時效果不佳。正規化的原理是在原本的損失函數 $L(\theta)$ 之後,額外加上一個描述模型複雜度的懲罰項 $\lambda R(\theta)$。當模型試圖讓參數變得極大以契合所有觀測值時,這個懲罰項會增加總損失,迫使模型在「配適精度」與「模型平滑度」之間取得平衡,從而提升模型的強健性。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題