高考申論題
106年
[統計] 迴歸分析
第 一 題
📖 題組:
一位分析師隨機抽取 55 位大學生並蒐集到五個變數。該分析師希望研究身高(Y,英吋)與受測者左前臂長度(X1,公分)、左腳長度(X2,公分)、頭圍(X3,公分)和鼻長(X4,公分)之間的關係。該分析師考慮配適下列三個迴歸模型: 模型 1:Yi = β0 + β1X1i + β2X2i + β3X3i + β4X4i + εi 模型 2:Yi = β0 + β1X1i + β2X2i + εi 模型 3:Yi = β0 + β1X1i + εi 請使用表 1 和表 2 中部分 R 統計軟體輸出之變異數分析表(ANOVA,Analysis of Variance)報表來回答以下問題:(每小題 10 分,共 30 分) 表 1 模型 1 ANOVA 表 Response:Y DF Sum of squares Mean square F value X1 1 590.21 590.21 123.8106 X2|X1 1 224.35 224.35 47.0621 X3|X1, X2 1 1.4 1.4 0.294 X4|X1, X2, X3 1 0.43 0.43 0.0896 Error 50 238.35 4.77 表 2 模型 2 ANOVA 表 Response:Y DF Sum of squares Mean square F value X1 1 590.21 590.21 127.782 X2| X1 1 224.35 224.35 48.572 Error 52 240.18 4.62
一位分析師隨機抽取 55 位大學生並蒐集到五個變數。該分析師希望研究身高(Y,英吋)與受測者左前臂長度(X1,公分)、左腳長度(X2,公分)、頭圍(X3,公分)和鼻長(X4,公分)之間的關係。該分析師考慮配適下列三個迴歸模型: 模型 1:Yi = β0 + β1X1i + β2X2i + β3X3i + β4X4i + εi 模型 2:Yi = β0 + β1X1i + β2X2i + εi 模型 3:Yi = β0 + β1X1i + εi 請使用表 1 和表 2 中部分 R 統計軟體輸出之變異數分析表(ANOVA,Analysis of Variance)報表來回答以下問題:(每小題 10 分,共 30 分) 表 1 模型 1 ANOVA 表 Response:Y DF Sum of squares Mean square F value X1 1 590.21 590.21 123.8106 X2|X1 1 224.35 224.35 47.0621 X3|X1, X2 1 1.4 1.4 0.294 X4|X1, X2, X3 1 0.43 0.43 0.0896 Error 50 238.35 4.77 表 2 模型 2 ANOVA 表 Response:Y DF Sum of squares Mean square F value X1 1 590.21 590.21 127.782 X2| X1 1 224.35 224.35 48.572 Error 52 240.18 4.62
📝 此題為申論題,共 3 小題
小題 (一)
假設該分析師採用模型 1。在顯著水準 α=0.05 之下,請檢定 X3和 X4兩個解釋變數是否可以從給定模型 1 中刪除。也就是用 α=0.05 檢定H0:β3 = β4 = 0,並試述對立假設,檢定統計量之值、決策法則和結論。並請計算偏相關係數 R^2_{Y,X3,X4|X1,X2}(partial R^2)。
思路引導 VIP
本題考查多元迴歸模型的部分 F 檢定(Partial F-test)與偏判定係數(Partial R-square)的計算。解題關鍵在於利用循序變異數分析表(Type I ANOVA)找出額外迴歸平方和(Extra Sum of Squares),以評估特定變數群對降低殘差平方和(SSE)的邊際貢獻。
小題 (二)
假設該分析師採用模型 2。也就是在模型中僅考慮了兩個解釋變數,這兩個解釋變數是學生的左前臂長度(X1)和左腳長度(X2)。該分析師想知道這兩個解釋變數是否與身高(Y)有線性關係。在顯著水準 α=0.05 之下,請檢定H0:β1 = β2 = 0。並請試述檢定統計量之值、決策法則和結論。另請計算模型 2 的調整的複判定係數 R^2(adj R^2,the adjusted R-squared)並試述其意義。又該分析師要把身高的單位英吋轉公分(英吋乘以 2.54),試述模型 2 的 adj R^2是否改變?
思路引導 VIP
本題重點在於運用 ANOVA 表進行整體模型的 F 檢定,並計算與解釋調整後判定係數(adj R²)。看到此題,應先將表 2 中的序列平方和加總得 SSR,配合 SSE 計算檢定統計量 F*,接著代入公式 1-(MSE/MST) 求解 adj R²;最後需具備統計觀念:線性變換不會改變相關性結構,故 adj R² 不受單位轉換影響。
小題 (三)
假設該分析師採用模型 3。只考慮模型中具有一個解釋變數,為學生的左前臂長度(X1)。在顯著水準 α=0.05 下,該分析師想知道一個額外的解釋變數 X2 是否在解釋身高上具有顯著的貢獻。也就是說,該分析師想知道 X2對模型 3 的貢獻。請協助回答此問題並說明對立假設、檢定統計量之值、決策法則和結論。在表 1 和表 2的 F 檢定中,請試述需要做何假設,才能執行這些 F 檢定。
思路引導 VIP
考生看到此題應立刻聯想到「額外變異數檢定(Extra Sum of Squares Test)」或「偏 F 檢定(Partial F-test)」。利用 Type I (循序) ANOVA 表中的 SSR(X2|X1) 與全模型 (Model 2) 的 MSE,即可建構 F 統計量來檢定新增變數的邊際貢獻。最後,務必點出 F 檢定的成立仰賴高斯-馬可夫定理及誤差項的常態性假設。