免費開始練習
moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 1 題

在統計學概念及方法中,下列哪些會受極端值影響?
① 中位數 ② 平均數 ③ 迴歸直線的係數 ④ 全距 ⑤ 眾數 ⑥ 四分位數距(IQR)
  • A ① ② ③ ④
  • B ② ③ ④
  • C ① ② ⑤
  • D ④ ⑥

思路引導 VIP

想像一組原本分佈均勻的數據,如果我們突然將其中一個數值無限放大,哪些計算公式會因為必須把「數值的大小」代入運算而導致結果劇烈變化?相對地,哪些方法只在乎數值的「排列順序」或「出現次數」,因此即使該數值變得很極端,計算出的結果依然會保持穩定?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出 (B),代表你對敘述統計量與模型穩定性的理解非常扎實。這題的難度在於如何區分哪些統計指標具備「抗性」(Robustness),哪些則是對變動高度敏感的。你的判斷完全正確,這顯示你已經建立了良好的數據直覺。

統計量的敏感度分析

在這些指標中,平均數 (②) 因為加總了所有數值,任何一個極端值的變動都會直接反映在結果上;而 全距 (④) 僅由最大值減去最小值決定,只要邊界出現異常,全距便會劇烈跳動。至於 迴歸直線的係數 (③),由於其核心邏輯(如最小平方法)在於最小化殘差平方和,位於邊緣的觀測值會產生巨大的「槓桿作用」,顯著拉動直線的方向。相比之下,中位數、眾數與四分位數距(IQR)只關注數據的「位置排序」或「頻率」,因此能有效抵抗極端值的干擾。

▼ 還有更多解析內容

🏷️ 相關主題

常見機率分配:常態、t 分配與卡方分配
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題