地特三等申論題
106年
[統計] 抽樣方法
第 一 題
📖 題組:
五、在兩階段抽樣法中,第一階段先將母體分成 N 個抽樣單位,以簡單隨機抽樣法抽出 n 個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成 Mi (i = 1, 2, ..., N)個抽樣單位,並從 n 個第一抽樣單位以簡單隨機抽樣法各抽出 mi (i = 1, 2, ..., n)個抽樣單位(y_{i1}, y_{i2}, ..., y_{im_i}, i = 1, 2, ..., n),稱為第二抽樣單位, Σ Mi = M, M_bar = M/N, y_bar_i = (Σ y_{ij})/m_i。 (一)在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分) (二)在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分) (三)若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分) (四)若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
五、在兩階段抽樣法中,第一階段先將母體分成 N 個抽樣單位,以簡單隨機抽樣法抽出 n 個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成 Mi (i = 1, 2, ..., N)個抽樣單位,並從 n 個第一抽樣單位以簡單隨機抽樣法各抽出 mi (i = 1, 2, ..., n)個抽樣單位(y_{i1}, y_{i2}, ..., y_{im_i}, i = 1, 2, ..., n),稱為第二抽樣單位, Σ Mi = M, M_bar = M/N, y_bar_i = (Σ y_{ij})/m_i。 (一)在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分) (二)在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分) (三)若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分) (四)若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
📝 此題為申論題,共 4 小題
小題 (一)
在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分)
思路引導 VIP
本題測驗抽樣設計的基本概念與極端情況的連結。考生應思考兩階段抽樣的結構(抽群集→抽元素)與分層隨機抽樣的結構(分層→層內全抽部分元素),找出讓兩者操作完全相同的條件參數(即第一階段抽樣率為100%)。
小題 (二)
在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分)
思路引導 VIP
思考兩階段抽樣與單階段群集抽樣的定義差異。群集抽樣是抽出群集後,對群集內的『所有』元素進行普查,因此只需點出第二階段的抽樣數量條件即可得分。
小題 (三)
若 M 未知,請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
思路引導 VIP
當母體總觀察值個數 M 未知時,無法直接使用簡單膨脹估計量求平均數。此時必須以樣本資訊同時估計「母體總和」與「母體單位總數」,因此解題核心在於使用「比例估計量(Ratio Estimator)」。變異數估計式則須透過泰勒展開式(Taylor linearization)求近似,且必須包含第一階段與第二階段的抽樣誤差。
小題 (四)
若在第一階段中不以簡單隨機抽樣法抽出 n 個抽樣單位,改以第 i(i = 1, 2, …, N)個被抽中的機率為 M_i/M(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數 μ_hat 的估計公式及 Var_hat(μ_hat) 的估計公式。(10 分)
思路引導 VIP
看到機率比例抽樣(PPS),應立即聯想到 Hansen-Hurwitz 估計量。當抽取機率正比於群集大小($p_i = M_i/M$)時,各個群集的總和估計值權重會抵銷,這使得母體平均數及變異數的估計公式大幅簡化。在有放回 PPS 抽樣的假設下,變異數的估計僅依賴抽出的各第一階單位平均數之間的樣本變異。