高考申論題
109年
[統計] 抽樣方法
第 五 題
📖 題組:
欣民里里長希望能將里內獲得整建該里休閒公園之經費用於該公園內規劃一狗公園,作為里民飼養家犬之活動空間。在該里的500戶中,里長以簡單隨機抽樣取出不放回的方式選擇了 50 戶作為樣本,調查資料顯示其中有 10 戶養狗。10 戶有養狗的樣本戶之數據如下: 家戶編號:68, 124, 136, 158, 248, 314, 379, 401, 452, 479 家犬隻數:1, 1, 1, 3, 1, 1, 4, 1, 1, 1 是否贊成:是, 是, 是, 否, 是, 否, 是, 否, 是, 否
欣民里里長希望能將里內獲得整建該里休閒公園之經費用於該公園內規劃一狗公園,作為里民飼養家犬之活動空間。在該里的500戶中,里長以簡單隨機抽樣取出不放回的方式選擇了 50 戶作為樣本,調查資料顯示其中有 10 戶養狗。10 戶有養狗的樣本戶之數據如下: 家戶編號:68, 124, 136, 158, 248, 314, 379, 401, 452, 479 家犬隻數:1, 1, 1, 3, 1, 1, 4, 1, 1, 1 是否贊成:是, 是, 是, 否, 是, 否, 是, 否, 是, 否
📝 此題為申論題,共 5 小題
小題 (五)
若有里民質疑樣本數過少以至於養狗戶數之推估精確度不足,若欲重新以相同抽樣設計執行此一調查,但要將推估養狗戶數比例控制在 95%信心水準下不超過正負 5%,請問樣本戶數至少需要多少?(10分)
思路引導 VIP
考生看到此題應立刻辨識出這是「簡單隨機抽樣(取出不放回)」中估計母體比例的樣本數計算題。解題關鍵在於利用前次調查結果作為母體比例的預估值($p=0.2$),並務必考量母體大小($N=500$)使用「有限母體校正因子(FPC)」來調整樣本數。
小題 (一)
估計該連鎖超商員工支持目前輪休制度的總人數。(5分)
思路引導 VIP
- 辨識抽樣法:這是一階段叢集抽樣 (One-stage Cluster Sampling),因為抽出了 15 個「分店」(叢集),並調查該分店內「所有」員工。
- 母體總數估計:利用樣本內支持人數的平均值 $\bar{a}$ 乘上總分店數 $N=100$。
小題 (二)
估計該連鎖超商員工支持目前輪休制度的比例,並求算此比例的95%信賴區間。依調查結果,該連鎖超商人資長宣稱,員工支持目前輪休制度的比例超過65%,請判斷人資長的宣稱是否正確。(15分)
思路引導 VIP
- 比例估計:在叢集抽樣中,比例 $\hat{p}$ 實際上是一個「比率估計量」(Ratio Estimator),公式為 $\hat{p} = \sum a_i / \sum M_i$。
- 變異數估計:比例估計量的變異數公式較複雜,涉及 $a_i - \hat{p}M_i$ 的變項:$\hat{V}(\hat{p}) = \frac{1-f}{n \bar{M}^2} \frac{\sum (a_i - \hat{p}M_i)^2}{n-1}$。
小題 (三)
該連鎖超商的員工福利委員會認為目前的輪休制度對員工不公平,遂提出了修正版本。現欲估計員工支持此修正版的輪休制度的比例,應該抽取多少家分店進行調查,才能達到95%誤差界限為0.05的要求?(5分)
思路引導 VIP
- 樣本數計算:針對叢集抽樣的比例估計量。
- 公式:$n = \frac{N s_c^2}{N D + s_c^2}$,其中 $s_c^2$ 是叢集變異數 $\frac{\sum (a_i - \hat{p}M_i)^2}{n-1}$,而 $D = (B^2 \bar{M}^2) / z^2$。
小題 (四)
調查資料中沒有養狗的家戶贊成設置狗公園的戶數是16戶,但是有人質疑此一抽樣設計或許沒有考慮家戶年齡結構,因為有高齡長者的家戶可能希望規劃友善樂齡運動空間,經重新審視資料,樣本中有20戶為家中有65歲以上高齡里民,而其中有2戶贊成,而戶籍資料顯示欣民里中有350戶家中有65歲以上長者,請問根據此一資料,在考量家戶年齡結構之要求下,贊成設置狗公園之比例不偏估計為何?你是否認為此一估計量較為恰當?請說明理由。(10分)
思路引導 VIP
看到題目提供未參與抽樣設計的母體輔助資訊(年齡結構戶數)時,應立即想到『事後分層估計(Post-stratification)』。解題需先從總樣本拆解出各層的樣本數與贊成數,求出各層樣本比例後,再以母體真實比例作為權重加權。評價時需從『樣本結構失衡校正』與『層間差異大可降低變異數』兩個抽樣理論切入說明。
📜 參考法條
N=500, n=50