地特三等申論題
110年
[統計] 迴歸分析
第 一 題
📖 題組:
二、依題一的資料,以人口密度作為反應變數,其他皆為解釋變數進行迴歸模型分析,得到以下參數估計結果: Estimate Std error (Intercept) 10,890.376 3,076.995 土地面積 -0.550 0.178 人口數 總計 0.053 0.0101 人口數 男 -0.110 0.022 人口數 女 NA NA 性別比例 -76.789 28.760 (一)參數估計表中之「NA」表示估計結果是不可得到的;詳述「人口數 女」之參數估計結果為「NA」之原因。(5 分) (二)詳述「土地面積」之迴歸係數估計值的意義。(5 分) (三)在顯著水準為 0.01 下,檢定各解釋變數之顯著性;並依此結果決定那些變數可被剔除。(10 分)
二、依題一的資料,以人口密度作為反應變數,其他皆為解釋變數進行迴歸模型分析,得到以下參數估計結果: Estimate Std error (Intercept) 10,890.376 3,076.995 土地面積 -0.550 0.178 人口數 總計 0.053 0.0101 人口數 男 -0.110 0.022 人口數 女 NA NA 性別比例 -76.789 28.760 (一)參數估計表中之「NA」表示估計結果是不可得到的;詳述「人口數 女」之參數估計結果為「NA」之原因。(5 分) (二)詳述「土地面積」之迴歸係數估計值的意義。(5 分) (三)在顯著水準為 0.01 下,檢定各解釋變數之顯著性;並依此結果決定那些變數可被剔除。(10 分)
📝 此題為申論題,共 3 小題
小題 (一)
參數估計表中之「NA」表示估計結果是不可得到的;詳述「人口數 女」之參數估計結果為「NA」之原因。(5 分)
思路引導 VIP
看到「NA」應立刻聯想到迴歸模型設計矩陣不可逆的問題,核心原因是解釋變數間存在「完全共線性(Perfect Multicollinearity)」。解題時需明確指出「人口數 總計 = 人口數 男 + 人口數 女」的恆等關係,並說明這會導致 $X^TX$ 矩陣成為奇異矩陣,無法求反矩陣進而無法估計參數。
小題 (二)
詳述「土地面積」之迴歸係數估計值的意義。(5 分)
思路引導 VIP
作答多元迴歸係數的意義時,首要關鍵是必須寫出「在其他解釋變數保持不變(固定)的情況下」這個前提。接著再精確描述自變數每變動一單位,應變數「期望值(平均而言)」的變動方向與數值。
小題 (三)
在顯著水準為 0.01 下,檢定各解釋變數之顯著性;並依此結果決定那些變數可被剔除。(10 分)
思路引導 VIP
看到「檢定各變數顯著性」,應直覺想到使用 t 檢定。需計算各解釋變數的 t 統計量(估計值除以標準誤),並與顯著水準對應的臨界值比較。身為進階統計分析者,除了執行機械式的檢定,更應敏銳察覺變數間潛在的共線性問題對模型選擇的實質影響。
📜 參考法條
t分配表