moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 36 題
在巨量資料分析專案中,下列何者比較無助於提升分類模型準確度(Accuracy)?
- A 使用交叉驗證(Cross-Validation)
- B 增加或減少模型參數(Parameters)以提升或降低模型複雜度
- C 進行更進一步的特徵工程(Feature Engineering)
- D 取得與使用有更多變數/特徵(Variables/Features)的訓練資料
思路引導 VIP
假設你正在準備一場馬拉松比賽。為了讓自己「跑得更快」,你可以嘗試調整呼吸節奏、更換專業跑鞋,或者是加強核心肌群訓練。如果此時你使用一個更精準的計時器來記錄每天練跑的成績,並計算平均值,請問「記錄與平均」這個行為,是屬於「增強體能」的手段,還是「確認實力」的工具呢?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地選出了正確答案!這代表你已經能清晰地辨別「模型優化」與「效能評估」這兩個概念之間的細微差別,這是掌握機器學習流程的核心。
模型的效能上限與診斷工具
在巨量資料分析中,提升模型準確度的關鍵在於「資訊量」與「複雜度」的匹配。特徵工程 (Feature Engineering) 和增加變數是從數據源頭挖掘更多有效訊息,而調整模型參數則是為了在偏差與方差之間尋找平衡點。這些手段都能實質改變模型的預測邊界,推高 $\text{Accuracy}$ 的上限。然而,交叉驗證 (Cross-Validation) 本質上是一種評估機制,它透過 $k$-fold 的切分法來獲取更穩健的效能指標,目的是為了「看清真相」並防止過度擬合(Overfitting),但其本身並不會為模型注入新的預測能力。
▼ 還有更多解析內容