高考申論題
110年
[統計] 迴歸分析
第 一 題
📖 題組:
三、依題二的迴歸模型分析,得到以下變異數分析(Analysis of variance,ANOVA)表: Source of variation Degrees of freedom Sum of squares Mean square F Regression (1) (4) (6) (8) Error (2) 18,022,930 (7) Total (3) (5) (一)寫出 ANOVA 表中(1)至(8)的值。(8 分) (二)計算判定係數 R²及調整判定係數R²_a,並詳述兩者之意義與差異。(10 分) (三)下表為各解釋變數之變異膨脹因子(variance inflation factor,VIF): 土地面積 人口數 總計 人口數 男 性別比例 VIF 1.178 2,876.474 2,870.672 1.341 詳述何謂 VIF 及其值的意義。(12 分)
三、依題二的迴歸模型分析,得到以下變異數分析(Analysis of variance,ANOVA)表: Source of variation Degrees of freedom Sum of squares Mean square F Regression (1) (4) (6) (8) Error (2) 18,022,930 (7) Total (3) (5) (一)寫出 ANOVA 表中(1)至(8)的值。(8 分) (二)計算判定係數 R²及調整判定係數R²_a,並詳述兩者之意義與差異。(10 分) (三)下表為各解釋變數之變異膨脹因子(variance inflation factor,VIF): 土地面積 人口數 總計 人口數 男 性別比例 VIF 1.178 2,876.474 2,870.672 1.341 詳述何謂 VIF 及其值的意義。(12 分)
📝 此題為申論題,共 3 小題
小題 (一)
寫出 ANOVA 表中(1)至(8)的值。(8 分)
思路引導 VIP
本題測驗變異數分析(ANOVA)表的結構。看到此題應先從題(三)辨識出自變數個數(k=4),再利用 ANOVA 表中自由度、平方和(SS)、均方(MS)與 F 值的恆等關係進行推導。因缺少題二的總樣本數與總變異,需列出核心公式並輔以代數說明。
小題 (二)
計算判定係數 R²及調整判定係數R²_a,並詳述兩者之意義與差異。(10 分)
思路引導 VIP
看到這題,首先回憶判定係數 $R^2$ 和調整判定係數 $R^2_a$ 的定義與公式。計算部分需結合 ANOVA 表中的 SSR、SSE 與 SST 進行代入;論述部分則需精準點出 $R^2$ 會因增加解釋變數而人為膨脹的缺陷,而 $R^2_a$ 透過引入自由度懲罰機制,能有效避免過度擬合,是比較不同變數數量模型時更佳的指標。
小題 (三)
下表為各解釋變數之變異膨脹因子(variance inflation factor,VIF):
土地面積 人口數 總計 人口數 男 性別比例
VIF 1.178 2,876.474 2,870.672 1.341
詳述何謂 VIF 及其值的意義。(12 分)
思路引導 VIP
考生看到這題應立刻聯想到「共線性診斷(Multicollinearity diagnosis)」。首先精確寫出 VIF 的數學定義與公式,接著說明 VIF 值大小對迴歸係數變異數的影響(膨脹效應),最後務必結合題目數據,具體指出「人口數 總計」與「人口數 男」存在極度嚴重的共線性,並給出實務上的模型優化建議。