高考申論題
110年
[統計] 抽樣方法
第 三 題
📖 題組:
某人欲研析某地區街貓數目,將該地區劃分為四等份並編號 i=1, 2, 3, 4 如下: 1 2 3 4 而其所採之抽樣設計分兩階段進行如下: ⑴首先隨機選擇一個區域並觀察該區域街貓數目(y_i)。 ⑵若y_i > 10,則繼續觀察其相鄰之兩個區域作為樣本區域,否則若 y_i ≤ 10,則隨機選擇剩下未觀察之三個區域中的其中一個區域作為樣本區 域。 例如若第 1 個區域在第⑴階段被選,且y_i ≤ 10,則在其他第 2, 3, 4 等三 個區域中再隨機選擇一個區域觀察,若y_i > 10,則繼續觀察第 2 及 3 個 區域。注意:第 1 及第 4 個區域不相鄰,同理第 2 及第 3 個區域不相鄰。 今假設該地區街貓實際分布如下: y_1 = 7, y_2 = 13, y_3 = 19, y_4 = 1 請根據此抽樣設計及母體,回答下列問題:(每小題 5 分,共 20 分)
某人欲研析某地區街貓數目,將該地區劃分為四等份並編號 i=1, 2, 3, 4 如下: 1 2 3 4 而其所採之抽樣設計分兩階段進行如下: ⑴首先隨機選擇一個區域並觀察該區域街貓數目(y_i)。 ⑵若y_i > 10,則繼續觀察其相鄰之兩個區域作為樣本區域,否則若 y_i ≤ 10,則隨機選擇剩下未觀察之三個區域中的其中一個區域作為樣本區 域。 例如若第 1 個區域在第⑴階段被選,且y_i ≤ 10,則在其他第 2, 3, 4 等三 個區域中再隨機選擇一個區域觀察,若y_i > 10,則繼續觀察第 2 及 3 個 區域。注意:第 1 及第 4 個區域不相鄰,同理第 2 及第 3 個區域不相鄰。 今假設該地區街貓實際分布如下: y_1 = 7, y_2 = 13, y_3 = 19, y_4 = 1 請根據此抽樣設計及母體,回答下列問題:(每小題 5 分,共 20 分)
📝 此題為申論題,共 4 小題
小題 (三)
若以觀察值之平均值,記為 y ,為母體平均之估計量,請問 y 之偏誤(bias)為何?
思路引導 VIP
這題要求的是 $\bar{y}$ (樣本平均數) 的偏誤。偏誤 = $E[\bar{y}] - \mu$。母體平均 $\mu$ 很容易計算。關鍵在於算出 $E[\bar{y}]$,這需要列出所有可能的樣本組合,算出各組合的平均值,再乘以該組合發生的機率進行期望值加總。注意,如果樣本大小 $n$ 不固定,計算平均時要用該次樣本的實際 $n$。
小題 (一)
若不考慮樣本出現順序,樣本組合為s = (2, 3)之機率為何?
思路引導 VIP
本題屬於「適應性抽樣」或「非等機率抽樣」的變形。解題重點在於釐清「樣本空間」的所有可能路徑。首先要識別哪些區域是相鄰的(1-2, 1-3, 2-4, 3-4),哪些不相鄰(1-4, 2-3)。接著,根據第一階段抽中 1, 2, 3, 4 的四種初始情況,分別計算第二階段會產生的樣本組合及其機率。最後檢查樣本組合是否包含 {2, 3}。
小題 (二)
第 4 個區域之抽樣包含機率(inclusion probability)?
思路引導 VIP
包含機率 $\pi_i$ 是指該單位在所有可能的樣本組合中出現的機率總和。我們需要回到(一)所列出的所有樣本路徑,找出哪些路徑包含「區域 4」,並將這些路徑的機率相加。
小題 (四)
請問 y 之均方誤差(mean square error)為何?
思路引導 VIP
MSE 的定義是 $E[(\bar{y} - \mu)^2]$。我們已經有了所有樣本的 $\bar{y}$、機率 $P(s)$ 以及母體平均 $\mu=10$。直接帶入公式計算即可。