高考申論題
106年
[統計] 迴歸分析
第 三 題
📖 題組:
某大數據資料分析公司以Y對三個變數X1,X2,X3所做的複迴歸分析中,樣本大小n=14,得到複判定係數R² = 90%,又將Y 改對變數X2做迴歸分析時,得到判定係數 R²=70%,請回答下列問題:(每小題5分,共15分)
某大數據資料分析公司以Y對三個變數X1,X2,X3所做的複迴歸分析中,樣本大小n=14,得到複判定係數R² = 90%,又將Y 改對變數X2做迴歸分析時,得到判定係數 R²=70%,請回答下列問題:(每小題5分,共15分)
📝 此題為申論題,共 3 小題
小題 (三)
承題(二),令R²₁代表解釋變數X₁對另一個解釋變數做迴歸分析得到的判定係數,j = 1,2, 且R²_1=0.65, R²_2=0.95,求出 X2之變異數膨脹因子(VIF),若 VIF 大於10代表模式有何問題?
思路引導 VIP
本題重點在於變異數膨脹因子(VIF)的定義與共線性診斷。先利用公式 VIF = 1/(1-R_j^2) 求出 X2 的 VIF 值,接著需闡述 VIF > 10 在實務上代表嚴重的多元共線性,並指出其對迴歸係數變異數膨脹及 t 檢定失效等負面影響。
小題 (一)
在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分)
思路引導 VIP
看到模型中的自變數採用平移後的型式 $(x - \bar{x})$,應立刻聯想到「中心化」簡單線性迴歸。此模型的特性在於截距項就是 $Y$ 的樣本平均數,且截距項與斜率項的估計值互不相關(共變異數為 0),接著透過給定的 SS 統計量算出估計值、SSE 及 MSE 後,再套用標準誤公式即可解題。
小題 (二)
請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分)
Source | Sum of Squares | DF | Mean square | F value
Regression | (1) | (4) | |
Error | (2) | (5) | (6) |
Total | (3) | | |
Source | Sum of Squares | DF | Mean square | F value
Regression | (1) | (4) | |
Error | (2) | (5) | (6) |
Total | (3) | | |
思路引導 VIP
本題測驗核心為建構變異數分析表(ANOVA Table)與進行整體模型顯著性檢定。考生應先利用給定的 SXX, SYY, SXY 推導出 SSR 與 SSE,完成表格後,再依據標準 F 檢定五步驟作答,最後切記列出線性迴歸殘差的四大古典假設(常態、獨立、同質變異、線性)。