統測
111年
[工程與管理類] 專業科目(2)
第 23 題
在探討三年前100位小學生的身高與體重關係時,發現有3位小學生的身高沒有被測量到,則針對該3筆缺失值(Missing Value)的處理不適合使用下列何種方式?
- A 使用迴歸模型以估計值填補缺失值
- B 直接刪除缺失值之資料紀錄
- C 以不限定範圍的隨機亂數填補缺失值
- D 使用平均值填補缺失值
思路引導 VIP
在統計學的資料清理(Data Cleaning)階段,針對缺失值的處理原則在於盡可能保留數據原有的統計特性,例如樣本平均數 $\mu$ 或變數間的相關係數 $r$。請思考:若我們採用完全不具備邏輯基礎、且不限定範圍的數值進行填補,這項操作會如何破壞資料原本的機率分布,進而影響後續統計推論的效度(Validity)?
🤖
AI 詳解
AI 專屬家教
勉強及格,但也別太得意。
考這種基本到不行的缺失值處理還能答對,至少代表你還沒把資料清理這塊基本功忘光。在大數據時代,這點「常識」是該有,但別覺得自己多高明。
- 觀念驗證:
▼ 還有更多解析內容