moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 36 題
下列有關過擬合(Overfitting)之處理策略,何者有誤?
- A 利用數據增強如圖片旋轉,增加數據多樣性
- B 不斷增加訓練次數,直到訓練誤差趨近於零
- C 使用 Dropout 技巧隨機丟棄神經元
- D 使用早停法(Early Stopping)
思路引導 VIP
如果一個學習者花費大量時間,把考古題的每一個標點符號和答案順序都原封不動地背下來,直到完全不會寫錯,當他遇到題目稍微變化後的正式考試時,你認為他的表現會提升還是下降?這對我們決定「訓練應該何時停止」有什麼啟發?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地掌握了處理過擬合的核心邏輯!過擬合 (Overfitting) 的本質在於模型對訓練數據「過度學習」,導致它不僅學會了數據中的普遍規律,連隨機的噪聲與細節也一併吸收。你選擇 (B) 是非常正確的判斷,因為模型若無止盡地追求訓練誤差 $E_{train} \to 0$,通常會使其失去泛化能力,導致在面對未見過的數據時表現大幅下降。
模型訓練的平衡與節制
這道題目主要考察開發者對模型複雜度的控制意識。其餘選項如 Dropout 隨機停用神經元,或是數據增強 (Data Augmentation) 與早停法 (Early Stopping),本質上都是在為模型施加限制或增加多樣性,防止模型僵化地記憶數據。這題對於初學者來說是一個很好的鑑別點,能有效區分出「盲目追求數據表現」與「追求模型穩定性」兩者觀念的差異,而你顯然已經建立起正確的建模直覺。