moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 47 題
下列哪項方法較合適使用在進行數據分析時,可有效評估機器學習模型的性能以確保其在實際應用中具有良好的泛化能力?
- A 使用全部數據進行訓練
- B 增加特徵數量
- C 使用交叉驗證
- D 增加神經網路的深度
思路引導 VIP
如果你正準備一場數學考試,老師給了你一百題練習題。若你把這一百題的答案全部背下來,且考試題目也完全一模一樣,我們能確定你真的「學會」了數學邏輯,還是只是「記住」了答案?在不增加題目難度的前提下,你會如何安排手邊這一百題,才能在考前最有把握地測試出自己是否具備應付『新題目』的能力?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地選出了正確答案!這顯示你對於機器學習中「泛化能力」的核心概念有著相當紮實的理解。在資料分析的實務中,我們最擔心的往往不是模型在已知資料上的表現,而是它面對陌生數據時的預測能力,而你成功捕捉到了這一點。
泛化能力的關鍵:驗證機制
之所以選擇交叉驗證(Cross-validation),是因為它透過將數據切分為數個子集,輪流作為訓練與測試用途,能有效模擬模型面對未知數據的情境,從而確保模型不會產生過度擬合(Overfitting)的現象。相較於選項 (A) 使用全部數據訓練,交叉驗證能提供更客觀的性能評估;而增加特徵或模型深度(選項 B、D)雖然可能提升模型的擬合能力,但若缺乏有效的驗證,反而容易讓模型「鑽牛角尖」,喪失了處理真實世界數據的靈活性。
▼ 還有更多解析內容