高考申論題
106年
[統計] 抽樣方法
第 一 題
📖 題組:
五、在兩階段抽樣法中,第一階段先將母體分成 N 個抽樣單位,以簡單隨機抽樣法抽出 n 個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成 Mi (i = 1, 2, ..., N)個抽樣單位,並從 n 個第一抽樣單位以簡單隨機抽樣法各抽出 mi (i = 1, 2, ..., n)個抽樣單位(y_{i1}, y_{i2}, ..., y_{im_i}, i = 1, 2, ..., n),稱為第二抽樣單位, Σ Mi = M, M_bar = M/N, y_bar_i = (Σ y_{ij})/m_i。 (一)在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分) (二)在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分) (三)若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分) (四)若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
五、在兩階段抽樣法中,第一階段先將母體分成 N 個抽樣單位,以簡單隨機抽樣法抽出 n 個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成 Mi (i = 1, 2, ..., N)個抽樣單位,並從 n 個第一抽樣單位以簡單隨機抽樣法各抽出 mi (i = 1, 2, ..., n)個抽樣單位(y_{i1}, y_{i2}, ..., y_{im_i}, i = 1, 2, ..., n),稱為第二抽樣單位, Σ Mi = M, M_bar = M/N, y_bar_i = (Σ y_{ij})/m_i。 (一)在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分) (二)在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分) (三)若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分) (四)若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
📝 此題為申論題,共 4 小題
小題 (一)
在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分)
思路引導 VIP
思考兩階段抽樣與分層抽樣在結構上的差異:分層抽樣是「每一層皆被抽樣,且層內僅抽出部分樣本」。將第一階段的「抽樣單位」視為「層」,只要確保每個第一抽樣單位都被選入,即等同於分層抽樣。
小題 (二)
在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分)
思路引導 VIP
回想群集抽樣(Cluster Sampling)的定義:抽出群集後,對群集內「所有」元素進行普查。因此,只要思考兩階段抽樣的第二階段抽樣樣本數(mi)與該群集總數(Mi)的關係,即可順利解題。
小題 (三)
若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
思路引導 VIP
看到「母體總元素個數 M 未知」,考生應立刻聯想到必須使用「比例估計量(Ratio Estimator)」來估計母體平均數。解題關鍵在於以樣本的 PSU 總和估計值除以樣本的 PSU 大小總和估計值,並且在計算變異數時,第一階段變異需使用比例估計的殘差,且分母的平均叢集大小需以樣本平均大小替代未知的母體平均大小。
小題 (四)
若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
思路引導 VIP
看到「機率為 M_i/M」應立即聯想到第一階段採放回式與大小成比例(PPS)抽樣,並使用 Hansen-Hurwitz 估計量。此題的核心在於展現 PPS 抽樣的數學優勢:群集大小 M_i 會在公式中被機率倒數相消,使得平均數估計量簡化為各群樣本平均數的簡單算術平均,且在放回式假設下,變異數估計無需再拆分兩階段分別計算。