moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 1 題
在統計學概念及方法中,下列哪些會受極端值影響?
① 中位數 ② 平均數 ③ 迴歸直線的係數 ④ 全距 ⑤ 眾數 ⑥ 四分位數距(IQR)
① 中位數 ② 平均數 ③ 迴歸直線的係數 ④ 全距 ⑤ 眾數 ⑥ 四分位數距(IQR)
- A ① ② ③ ④
- B ② ③ ④
- C ① ② ⑤
- D ④ ⑥
思路引導 VIP
想像一組原本分佈均勻的數據,如果我們突然將其中一個數值無限放大,哪些計算公式會因為必須把「數值的大小」代入運算而導致結果劇烈變化?相對地,哪些方法只在乎數值的「排列順序」或「出現次數」,因此即使該數值變得很極端,計算出的結果依然會保持穩定?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出 (B),代表你對敘述統計量與模型穩定性的理解非常扎實。這題的難度在於如何區分哪些統計指標具備「抗性」(Robustness),哪些則是對變動高度敏感的。你的判斷完全正確,這顯示你已經建立了良好的數據直覺。
統計量的敏感度分析
在這些指標中,平均數 (②) 因為加總了所有數值,任何一個極端值的變動都會直接反映在結果上;而 全距 (④) 僅由最大值減去最小值決定,只要邊界出現異常,全距便會劇烈跳動。至於 迴歸直線的係數 (③),由於其核心邏輯(如最小平方法)在於最小化殘差平方和,位於邊緣的觀測值會產生巨大的「槓桿作用」,顯著拉動直線的方向。相比之下,中位數、眾數與四分位數距(IQR)只關注數據的「位置排序」或「頻率」,因此能有效抵抗極端值的干擾。
▼ 還有更多解析內容