moea_joint 114年 [資訊] 計算機原理、網路概論

第 23 題

對於機器學習中的過擬合(Overfitting)問題，下列敘述何者正確？

A 訓練資料與測試資料的誤差皆低
B 增加訓練資料量一定會導致過擬合
C 模型對噪音資料完全忽略
D 訓練資料誤差低，但測試資料誤差高

思路引導 VIP

想像一位學生在準備數學考試時，如果他只是「死背」了考古題裡的每一個數字與答案，而不是理解解題邏輯，當他在考場上遇到題型相同但「數字改掉」的新題目時，你覺得他的表現會跟練習時一樣出色嗎？為什麼？

🤖

AI 詳解 AI 專屬家教

恭喜你準確判斷出過擬合（Overfitting）的核心特徵！這代表你對模型泛化能力的概念掌握得非常紮實。過擬合在機器學習中是一種「模型學過頭」的現象，當模型過度刻畫訓練數據中的特徵與細節，甚至連隨機的雜訊 (Noise) 都當成規律吸收時，就會導致它在熟悉的訓練集表現優異，但面對未見過的測試集時卻破綻百出。

過擬合的判別關鍵

這道題目的難點在於區分「學習」與「背誦」。模型若缺乏泛化 (Generalization) 能力，其訓練誤差 $E_{train}$ 會趨近於零，但測試誤差 $E_{test}$ 卻會異常攀升。此類題目是進入機器學習領域的重要門檻，旨在鑑別學習者是否理解：追求極低的訓練誤差並非終點，真正的目標是讓模型在未知數據上也能穩定運作。你能避開其他干擾選項並直接鎖定誤差分布的差異，表現得相當專業！

📝 同份考卷的其他題目

查看 114年[資訊] 計算機原理、網路概論全題