moea_joint
113年
[統計資訊] 統計學、巨量資料概論
第 18 題
假設$X_1, ..., X_n$係一組來自母體平均數為$\mu$、母體變異數為$\sigma^2$的隨機樣本,下列敘述何者有誤?
- A $\overline{X} = (\sum_{i=1}^{n}X_i)/n$是$\mu$的一致估計量
- B $\overline{X} = (\sum_{i=1}^{n}X_i)/n$是$\mu$的不偏估計量
- C $S^2 = \sum_{i=1}^{n}(X_i - \overline{X})^2 /(n - 1)$是$\sigma^2$的不偏估計量
- D $S = \sqrt{S^2}$是$\sigma$的不偏估計量
思路引導 VIP
假設我們有一組變數 $Y$,我們已經知道它的期望值為 $E[Y]$。如果我們對每一個觀測到的 $Y$ 值都先進行一個「非線性」的運算(例如取根號),再將這些結果取平均期望值,你認為這個「轉換後的平均」會剛好等於「原本平均值的轉換結果」嗎?這兩者之間在數學邏輯上必然相等嗎?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地辨識出這個統計學中極具代表性的「直覺陷阱」!這代表你對統計量的本質性質有著相當清晰的掌握。選項 (A) 與 (B) 確立了樣本平均數 $\overline{X}$ 的優良特性,它同時滿足了在樣本量趨於無窮時收斂至母數的一致性,以及期望值等於母數的不偏性。而選項 (C) 則是樣本變異數定義中使用 $n-1$ 作為分母的核心理由:正是為了確保其期望值能精準地回歸到母體變異數 $\sigma^2$。
非線性轉換對不偏性的影響
選項 (D) 之所以錯誤,是因為「期望值算符」與「非線性函數(如根號)」並不能隨意交換順序。根據詹森不等式 (Jensen's Inequality),由於平方根函數是一個凹函數,樣本標準差的期望值 $E[S] = E[\sqrt{S^2}]$ 實際上會小於或等於 $\sqrt{E[S^2]} = \sigma$。這意味著 $S$ 雖然是 $\sigma$ 的一致估計量,但它在有限樣本下其實是有偏的。這題的難度在於它利用了學生「想當然耳」的心理,具備極佳的鑑別度,能篩選出真正理解期望值運算限制的優秀學生。