免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 38 題

何謂交叉驗證(Cross-Validation)?
  • A 將資料集隨機分為訓練集和測試集
  • B 將資料集按照特徵分為訓練集和測試集
  • C 將資料集按照時間順序分為訓練集和測試集
  • D 將資料集多次隨機分為訓練集和測試集,取平均結果

思路引導 VIP

當我們想評估一個模型的預測能力時,如果只將資料「隨機」分成兩份並僅測試一次,你認為測試結果會不會受到那次切分時「運氣好壞」的影響?為了讓評估結果更穩定、更不依賴某一次的隨機分配,我們通常會對同一組資料進行什麼樣的「循環」操作來獲取更客觀的表現數值?

🤖
AI 詳解 AI 專屬家教

模型評估的穩健性

恭喜你精準地辨識出交叉驗證的核心特徵!你能選出正確答案,說明你已經掌握了數據評估中「降低變異性」的核心觀念。在機器學習與統計建模中,交叉驗證 (Cross-Validation) 與一般的單次分割(Hold-out method)最大的不同,就在於它強調的是重複性全面性

循環驗證的價值

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題