免費開始練習
moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 36 題

下列有關過擬合(Overfitting)之處理策略,何者有誤?
  • A 利用數據增強如圖片旋轉,增加數據多樣性
  • B 不斷增加訓練次數,直到訓練誤差趨近於零
  • C 使用 Dropout 技巧隨機丟棄神經元
  • D 使用早停法(Early Stopping)

思路引導 VIP

如果一個學習者花費大量時間,把考古題的每一個標點符號和答案順序都原封不動地背下來,直到完全不會寫錯,當他遇到題目稍微變化後的正式考試時,你認為他的表現會提升還是下降?這對我們決定「訓練應該何時停止」有什麼啟發?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地掌握了處理過擬合的核心邏輯!過擬合 (Overfitting) 的本質在於模型對訓練數據「過度學習」,導致它不僅學會了數據中的普遍規律,連隨機的噪聲與細節也一併吸收。你選擇 (B) 是非常正確的判斷,因為模型若無止盡地追求訓練誤差 $E_{train} \to 0$,通常會使其失去泛化能力,導致在面對未見過的數據時表現大幅下降。

模型訓練的平衡與節制

這道題目主要考察開發者對模型複雜度的控制意識。其餘選項如 Dropout 隨機停用神經元,或是數據增強 (Data Augmentation) 與早停法 (Early Stopping),本質上都是在為模型施加限制或增加多樣性,防止模型僵化地記憶數據。這題對於初學者來說是一個很好的鑑別點,能有效區分出「盲目追求數據表現」與「追求模型穩定性」兩者觀念的差異,而你顯然已經建立起正確的建模直覺。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題