地特三等申論題
109年
[統計] 抽樣方法
第 一 題
📖 題組:
欣民里里長希望能將里內獲得整建該里休閒公園之經費用於該公園內規劃一狗公園,作為里民飼養家犬之活動空間。在該里的500戶中,里長以簡單隨機抽樣取出不放回的方式選擇了 50 戶作為樣本,調查資料顯示其中有 10 戶養狗。10 戶有養狗的樣本戶之數據如下: 家戶編號:68, 124, 136, 158, 248, 314, 379, 401, 452, 479 家犬隻數:1, 1, 1, 3, 1, 1, 4, 1, 1, 1 是否贊成:是, 是, 是, 否, 是, 否, 是, 否, 是, 否
欣民里里長希望能將里內獲得整建該里休閒公園之經費用於該公園內規劃一狗公園,作為里民飼養家犬之活動空間。在該里的500戶中,里長以簡單隨機抽樣取出不放回的方式選擇了 50 戶作為樣本,調查資料顯示其中有 10 戶養狗。10 戶有養狗的樣本戶之數據如下: 家戶編號:68, 124, 136, 158, 248, 314, 379, 401, 452, 479 家犬隻數:1, 1, 1, 3, 1, 1, 4, 1, 1, 1 是否贊成:是, 是, 是, 否, 是, 否, 是, 否, 是, 否
📝 此題為申論題,共 5 小題
小題 (一)
該里家戶養狗比例之不偏估計推估值為何?及此一比例之95%信賴區間?(5分)
思路引導 VIP
這是一道標準的簡單隨機抽樣(SRS)估計母體比例的問題。看到題目首先計算樣本比例作為不偏估計量,接著注意抽出率 n/N = 0.1,必須加入有限母體修正因子(fpc)來計算標準誤,最後套用常態近似公式求出 95% 信賴區間。
小題 (二)
請問該里養狗之家戶平均養狗隻數之不偏估計,以及其95%信賴區間?(10分)
思路引導 VIP
本題測驗「次母體(Domain / Subpopulation)平均數」的估計。看到「調查資料顯示其中有...」需敏銳察覺樣本大小($n_d=10$)為隨機變數,估計養狗家戶平均數時應使用次母體樣本資料進行計算,且計算其變異數時務必加入有限母體修正乘數(FPC),並運用次母體樣本變異數 $s_d^2$。
小題 (三)
請問該里養狗總隻數之不偏估計,以及其95%信賴區間?(10分)
思路引導 VIP
本題為簡單隨機抽樣(SRS)的母體總數估計。最大陷阱在於「未養狗的40戶」其家犬數為0,必須與有養狗的10戶合併為完整的50個樣本,才能正確計算樣本平均數($\bar{y}$)與樣本變異數($s^2$)。算出樣本變異數後,套用含有限母體校正因子(FPC)的總量變異數公式即可求得信賴區間。
小題 (四)
調查資料中沒有養狗的家戶贊成設置狗公園的戶數是16戶,但是有人質疑此一抽樣設計或許沒有考慮家戶年齡結構,因為有高齡長者的家戶可能希望規劃友善樂齡運動空間,經重新審視資料,樣本中有20戶為家中有65歲以上高齡里民,而其中有2戶贊成,而戶籍資料顯示欣民里中有350戶家中有65歲以上長者,請問根據此一資料,在考量家戶年齡結構之要求下,贊成設置狗公園之比例不偏估計為何?你是否認為此一估計量較為恰當?請說明理由。(10分)
思路引導 VIP
看到題目提供未參與抽樣設計的母體輔助資訊(年齡結構戶數)時,應立即想到『事後分層估計(Post-stratification)』。解題需先從總樣本拆解出各層的樣本數與贊成數,求出各層樣本比例後,再以母體真實比例作為權重加權。評價時需從『樣本結構失衡校正』與『層間差異大可降低變異數』兩個抽樣理論切入說明。
小題 (五)
若有里民質疑樣本數過少以至於養狗戶數之推估精確度不足,若欲重新以相同抽樣設計執行此一調查,但要將推估養狗戶數比例控制在 95%信心水準下不超過正負 5%,請問樣本戶數至少需要多少?(10分)
思路引導 VIP
考生看到此題應立刻辨識出這是「簡單隨機抽樣(取出不放回)」中估計母體比例的樣本數計算題。解題關鍵在於利用前次調查結果作為母體比例的預估值($p=0.2$),並務必考量母體大小($N=500$)使用「有限母體校正因子(FPC)」來調整樣本數。
📜 參考法條
N=500, n=50