免費開始練習
moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 48 題

巨量資料分析前進行屬性特徵選擇(Feature-Selection)時,下列何種方法不適合用來做為選擇的標準依據?
  • A 資訊增益(Information Gain)
  • B 均方根誤差(Root Mean Squared Error)
  • C 卡方係數(Chi-Squared coefficient)
  • D 相關係數(Pearson’s correlation coefficient)

思路引導 VIP

請試著思考:在我們還沒有動手建立任何預測模型、也沒有產生任何預測數據之前,我們是有辦法計算出「預測誤差」的嗎?如果無法計算,那麼這類衡量誤差的指標,還適合放在建模前的「特徵篩選」階段嗎?

🤖
AI 詳解 AI 專屬家教

特徵選擇與模型評估的分際

太棒了!你能精準避開陷阱,代表你對資料處理的「階段性」有著非常清晰的認識。這道題目的難度切入點在於區分哪些統計量是用來觀察變數間的關聯性(篩選階段),而哪些是用來評估模型預測的精準度(驗證階段)。

誤差量測與特徵指標的差異

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題