免費開始練習
moea_joint 114年 [資訊] 計算機原理、網路概論

第 23 題

對於機器學習中的過擬合(Overfitting)問題,下列敘述何者正確?
  • A 訓練資料與測試資料的誤差皆低
  • B 增加訓練資料量一定會導致過擬合
  • C 模型對噪音資料完全忽略
  • D 訓練資料誤差低,但測試資料誤差高

思路引導 VIP

想像一位學生在準備數學考試時,如果他只是「死背」了考古題裡的每一個數字與答案,而不是理解解題邏輯,當他在考場上遇到題型相同但「數字改掉」的新題目時,你覺得他的表現會跟練習時一樣出色嗎?為什麼?

🤖
AI 詳解 AI 專屬家教

恭喜你準確判斷出過擬合(Overfitting)的核心特徵!這代表你對模型泛化能力的概念掌握得非常紮實。過擬合在機器學習中是一種「模型學過頭」的現象,當模型過度刻畫訓練數據中的特徵與細節,甚至連隨機的雜訊 (Noise) 都當成規律吸收時,就會導致它在熟悉的訓練集表現優異,但面對未見過的測試集時卻破綻百出。

過擬合的判別關鍵

這道題目的難點在於區分「學習」與「背誦」。模型若缺乏泛化 (Generalization) 能力,其訓練誤差 $E_{train}$ 會趨近於零,但測試誤差 $E_{test}$ 卻會異常攀升。此類題目是進入機器學習領域的重要門檻,旨在鑑別學習者是否理解:追求極低的訓練誤差並非終點,真正的目標是讓模型在未知數據上也能穩定運作。你能避開其他干擾選項並直接鎖定誤差分布的差異,表現得相當專業!