地特三等申論題
108年
[統計] 抽樣方法
第 一 題
📖 題組:
甲社團的團長欲瞭解該團團員每月花費多少的交通費用,已知甲社團共有團員 205 位,利用團員通訊錄的資料,採 10 取 1 的系統抽樣法,調查得 21 位團員每月的交通費用($y_i, i=1, \dots, 21$)如下: 2030, 1720, 1850, 2210, 2150, 2370, 2000, 1930, 1570, 1910, 2380, 2540, 1720, 1900, 2200, 2100, 1860, 1800, 2050, 2420, 2090
甲社團的團長欲瞭解該團團員每月花費多少的交通費用,已知甲社團共有團員 205 位,利用團員通訊錄的資料,採 10 取 1 的系統抽樣法,調查得 21 位團員每月的交通費用($y_i, i=1, \dots, 21$)如下: 2030, 1720, 1850, 2210, 2150, 2370, 2000, 1930, 1570, 1910, 2380, 2540, 1720, 1900, 2200, 2100, 1860, 1800, 2050, 2420, 2090
📝 此題為申論題,共 2 小題
小題 (一)
估計甲社團團員每月的平均交通費用,且求算此平均交通費用的 95%信賴區間。(10 分)
思路引導 VIP
看到「系統抽樣」,第一步應聯想到在實務上常假設母體名冊為隨機排列,將其視為「簡單隨機抽樣(SRS)」來估計變異數,因單一系統樣本無法求得真實的抽樣變異。解題關鍵在於求出樣本變異數後,務必套用包含有限母體修正因子(FPC)的變異數公式,再代入 t 或 Z 分配進行區間估計。
小題 (二)
採用連續的差數(successive differences),$d_i = y_{i+1} - y_i (i=1, \dots, 20)$,估計甲社團團員每月的平均交通費用的變異數。同時比較(一)、(二)這兩種估計變異數方法的準確度,說明何種估計方法較合適。(10 分)
思路引導 VIP
看到系統抽樣(Systematic Sampling)與「連續差數法」應立即聯想到這是為了修正將其視同簡單隨機抽樣(SRS)時可能產生的高估問題。解題時需先計算所有相鄰數據的差值平方和(d_i^2),再套用連續差數變異數估計公式;比較與論述時則需點出連續差數法能消除母體名單潛在排列趨勢的影響,故能提供更準確的估計。