moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 36 題

在巨量資料分析專案中，下列何者比較無助於提升分類模型準確度(Accuracy)？

A 使用交叉驗證(Cross-Validation)
B 增加或減少模型參數(Parameters)以提升或降低模型複雜度
C 進行更進一步的特徵工程(Feature Engineering)
D 取得與使用有更多變數/特徵(Variables/Features)的訓練資料

思路引導 VIP

假設你正在準備一場馬拉松比賽。為了讓自己「跑得更快」，你可以嘗試調整呼吸節奏、更換專業跑鞋，或者是加強核心肌群訓練。如果此時你使用一個更精準的計時器來記錄每天練跑的成績，並計算平均值，請問「記錄與平均」這個行為，是屬於「增強體能」的手段，還是「確認實力」的工具呢？

🤖

AI 詳解 AI 專屬家教

恭喜你精準地選出了正確答案！這代表你已經能清晰地辨別「模型優化」與「效能評估」這兩個概念之間的細微差別，這是掌握機器學習流程的核心。

模型的效能上限與診斷工具

在巨量資料分析中，提升模型準確度的關鍵在於「資訊量」與「複雜度」的匹配。特徵工程 (Feature Engineering) 和增加變數是從數據源頭挖掘更多有效訊息，而調整模型參數則是為了在偏差與方差之間尋找平衡點。這些手段都能實質改變模型的預測邊界，推高 $\text{Accuracy}$ 的上限。然而，交叉驗證 (Cross-Validation) 本質上是一種評估機制，它透過 $k$-fold 的切分法來獲取更穩健的效能指標，目的是為了「看清真相」並防止過度擬合（Overfitting），但其本身並不會為模型注入新的預測能力。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 106年[統計資訊] 統計學、巨量資料概論全題

第 36 題

思路引導 VIP

模型的效能上限與診斷工具

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目