高考申論題
111年
[統計] 抽樣方法
第 一 題
📖 題組:
今有一母體,其中有三個單元,各單元編號 $i$ 及其主要母體變量值 $y_i$ 如下表: | $i$ | 1 | 2 | 3 | |---|---|---|---| | $y_i$ | 7 | 5 | 3 | 若要從該母體中選擇 2 個單元作為樣本,在不考慮抽樣順序及可重複選擇之情形下,共有 6 種可能之樣本組合,考慮一抽樣設計為每組樣本組合 $s = (i, j)$,被選擇到之選擇機率為 $p(s) = (i+j)/24$,例如樣本組合 (2,3) 之選擇機率為 5/24,(1,1) 被選擇之機率為 2/24……等。請回答下列問題(建議以分數計算及作答):
今有一母體,其中有三個單元,各單元編號 $i$ 及其主要母體變量值 $y_i$ 如下表: | $i$ | 1 | 2 | 3 | |---|---|---|---| | $y_i$ | 7 | 5 | 3 | 若要從該母體中選擇 2 個單元作為樣本,在不考慮抽樣順序及可重複選擇之情形下,共有 6 種可能之樣本組合,考慮一抽樣設計為每組樣本組合 $s = (i, j)$,被選擇到之選擇機率為 $p(s) = (i+j)/24$,例如樣本組合 (2,3) 之選擇機率為 5/24,(1,1) 被選擇之機率為 2/24……等。請回答下列問題(建議以分數計算及作答):
📝 此題為申論題,共 5 小題
小題 (一)
請問在本抽樣設計下,第 $i$ 個單元被選到之包含機率(Inclusion Probability)若為 $\pi_i$,則 $\pi_2$ 為何?(5 分)
思路引導 VIP
- 理解機率定義:包含機率 $\pi_i$ 是指樣本中「含有單元 $i$」的所有樣本組合機率總和。
- 列舉樣本空間:樣本組合包含 (1,1), (1,2), (1,3), (2,2), (2,3), (3,3)。
小題 (二)
請問若以樣本平均 $\bar{y} = \frac{\sum_{i \in s} y_i}{2}$ 作為母體平均 $\mu = \frac{\sum_{i=1}^3 y_i}{3}$ 之估計量,則 $\bar{y}$ 在本設計下推估 $\mu$ 之偏誤(Bias)為何?(5 分)
思路引導 VIP
- 定義偏誤:$Bias(\bar{y}) = E[\bar{y}] - \mu$。
- 計算母體平均 $\mu$:直接根據給定 $y_i$ 計算。
小題 (三)
$\bar{y}$ 在本設計下之均方誤差(Mean square error;MSE)為何?(5 分)
思路引導 VIP
- 公式:$MSE(\bar{y}) = E[(\bar{y} - \mu)^2]$。
- 計算方法:對 6 種樣本組合,計算 $(\bar{y}_s - 5)^2$,再乘上各自機率 $p(s)$ 後加總。
小題 (四)
請就本設計提出一不偏估計量,請問您提出之估計量在樣本組合分別為(2,3)及(3,3)的情況下之估計值為何?並證明或以本母體為例驗證該估計量為不偏。(10 分)
思路引導 VIP
- 核心理論:在非等機率抽樣下,最著名的不偏估計量是「Horvitz-Thompson (HT) 估計量」。
- HT 公式:對於母體平均,$\hat{\mu}{HT} = \frac{1}{N} \sum{i \in s} \frac{y_i}{\pi_i}$(適用於無重複抽樣)。
小題 (五)
請試述您要如何評估您所提出之不偏估計與 $\bar{y}$ 在本設計下孰優孰劣?(不須計算實際數值)(5 分)
思路引導 VIP
- 評估準則:在抽樣方法中,比較兩個估計量優劣的標準通常是「均方誤差 (MSE)」或「變異數 (Variance)」以及「偏誤 (Bias)」。
- 論述邏輯:$\bar{y}$ 雖然有偏誤,但 MSE 可能較小(偏誤-變異權衡)。不偏估計量雖然 Bias=0,但若權重(機率倒數)差異過大,其變異數可能噴發。