免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 36 題

在巨量資料分析專案中,下列何者比較無助於提升分類模型準確度(Accuracy)?
  • A 使用交叉驗證(Cross-Validation)
  • B 增加或減少模型參數(Parameters)以提升或降低模型複雜度
  • C 進行更進一步的特徵工程(Feature Engineering)
  • D 取得與使用有更多變數/特徵(Variables/Features)的訓練資料

思路引導 VIP

假設你正在準備一場馬拉松比賽。為了讓自己「跑得更快」,你可以嘗試調整呼吸節奏、更換專業跑鞋,或者是加強核心肌群訓練。如果此時你使用一個更精準的計時器來記錄每天練跑的成績,並計算平均值,請問「記錄與平均」這個行為,是屬於「增強體能」的手段,還是「確認實力」的工具呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地選出了正確答案!這代表你已經能清晰地辨別「模型優化」與「效能評估」這兩個概念之間的細微差別,這是掌握機器學習流程的核心。

模型的效能上限與診斷工具

在巨量資料分析中,提升模型準確度的關鍵在於「資訊量」與「複雜度」的匹配。特徵工程 (Feature Engineering)增加變數是從數據源頭挖掘更多有效訊息,而調整模型參數則是為了在偏差與方差之間尋找平衡點。這些手段都能實質改變模型的預測邊界,推高 $\text{Accuracy}$ 的上限。然而,交叉驗證 (Cross-Validation) 本質上是一種評估機制,它透過 $k$-fold 的切分法來獲取更穩健的效能指標,目的是為了「看清真相」並防止過度擬合(Overfitting),但其本身並不會為模型注入新的預測能力。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題