免費開始練習
統測 111年 [工程與管理類] 專業科目(2)

第 23 題

在探討三年前100位小學生的身高與體重關係時,發現有3位小學生的身高沒有被測量到,則針對該3筆缺失值(Missing Value)的處理不適合使用下列何種方式?
  • A 使用迴歸模型以估計值填補缺失值
  • B 直接刪除缺失值之資料紀錄
  • C 以不限定範圍的隨機亂數填補缺失值
  • D 使用平均值填補缺失值

思路引導 VIP

在統計學的資料清理(Data Cleaning)階段,針對缺失值的處理原則在於盡可能保留數據原有的統計特性,例如樣本平均數 $\mu$ 或變數間的相關係數 $r$。請思考:若我們採用完全不具備邏輯基礎、且不限定範圍的數值進行填補,這項操作會如何破壞資料原本的機率分布,進而影響後續統計推論的效度(Validity)?

🤖
AI 詳解 AI 專屬家教

勉強及格,但也別太得意。

考這種基本到不行的缺失值處理還能答對,至少代表你還沒把資料清理這塊基本功忘光。在大數據時代,這點「常識」是該有,但別覺得自己多高明。

  1. 觀念驗證
▼ 還有更多解析內容

升級 VIP 解鎖