普考申論題
110年
[經建行政] 統計學概要
第 二 題
📖 題組:
有一位候選人在宣告參選之前,評估選民對他的初始支持率。不做任何事前公開活動之前提下,若選民支持他的比例數 p 大約 0.15,他將投入選戰。從隨機選取的 n 個選民的ㄧ項民調中,該候選人希望比例數 p 的估計值 y/n 距離 p 在 0.03 之內。也就是說,決策乃基於形如 y/n ± 0.03的ㄧ個 95%信賴區間,y 代表支持該候選人的選民人數:
有一位候選人在宣告參選之前,評估選民對他的初始支持率。不做任何事前公開活動之前提下,若選民支持他的比例數 p 大約 0.15,他將投入選戰。從隨機選取的 n 個選民的ㄧ項民調中,該候選人希望比例數 p 的估計值 y/n 距離 p 在 0.03 之內。也就是說,決策乃基於形如 y/n ± 0.03的ㄧ個 95%信賴區間,y 代表支持該候選人的選民人數:
📝 此題為申論題,共 3 小題
小題 (二)
假設由該選區隨機選取 1,068 個選民進行訪談,得到 y = 214 個選民的支持,求 p 的 95%信賴區間。根據此樣本所提供的訊息,該候選人是否決定投入選戰?(5 分)
思路引導 VIP
本題測驗「母體比例的信賴區間構建」及「基於信賴區間的決策」。首先算出樣本比例 p̂ = 214/1068,接著計算實際樣本的標準誤,最後組合出信賴區間 [p̂ - ZSE, p̂ + ZSE]。決策的部分,需觀察該信賴區間的下限是否大於題幹設立的參選門檻 (0.15)。
小題 (一)
在候選人對於 p 的大小沒有任何概念下,如何決定所需樣本數大小,以便達到所求之可靠度及準確度?(5 分)
思路引導 VIP
此為「決定樣本數 (Sample Size Determination)」的標準題。考點在於:當缺乏母體比例先驗資訊時,應採用最保守的估計,即令 p = 0.5 來最大化變異數。使用公式 n = [Z^2 * p(1-p)] / E^2。95% 信賴水準對應的 Z 值為 1.96,最大誤差 E = 0.03。
小題 (三)
比較(二)的最大誤差與 0.03,說明為何會有如此差別?(5 分)
思路引導 VIP
要求比較事前規劃的最大誤差 (0.03) 與事後實際計算的誤差界限 (約 0.024)。考生需要解釋兩者差異的來源:在(一)中使用了變異數最大化的保守假設 (p=0.5);而在(二)中有了實際數據 (p̂=0.2),其變異數 p̂(1-p̂) 遠小於 0.25,因此在樣本數不變的情況下,實際計算出的標準誤與誤差範圍會縮小。