高考申論題
106年
[統計] 迴歸分析
第 一 題
📖 題組:
一位數據分析師受冰飲企業老闆的委託,欲知道每日最高溫和該公司冰品銷售是否有線性關係,以作為未來商品促銷的依據。他蒐集了每日最高溫(X,以攝氏為單位)和冰品銷售(Y),共 30 個樣本點。下列是這些數據的統計量: n = 30, X_bar = 28.9892,Y_bar = 34.7065,SXY = 360.2128 SXX = 556.0186,SYY = 353.0085 (一)在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分) (二)請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分) Source | Sum of Squares | DF | Mean square | F value Regression | (1) | (4) | | Error | (2) | (5) | (6) | Total | (3) | | |
一位數據分析師受冰飲企業老闆的委託,欲知道每日最高溫和該公司冰品銷售是否有線性關係,以作為未來商品促銷的依據。他蒐集了每日最高溫(X,以攝氏為單位)和冰品銷售(Y),共 30 個樣本點。下列是這些數據的統計量: n = 30, X_bar = 28.9892,Y_bar = 34.7065,SXY = 360.2128 SXX = 556.0186,SYY = 353.0085 (一)在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分) (二)請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分) Source | Sum of Squares | DF | Mean square | F value Regression | (1) | (4) | | Error | (2) | (5) | (6) | Total | (3) | | |
📝 此題為申論題,共 3 小題
小題 (一)
在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分)
思路引導 VIP
看到模型中的自變數採用平移後的型式 $(x - \bar{x})$,應立刻聯想到「中心化」簡單線性迴歸。此模型的特性在於截距項就是 $Y$ 的樣本平均數,且截距項與斜率項的估計值互不相關(共變異數為 0),接著透過給定的 SS 統計量算出估計值、SSE 及 MSE 後,再套用標準誤公式即可解題。
小題 (二)
請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分)
Source | Sum of Squares | DF | Mean square | F value
Regression | (1) | (4) | |
Error | (2) | (5) | (6) |
Total | (3) | | |
思路引導 VIP
本題測驗核心為建構變異數分析表(ANOVA Table)與進行整體模型顯著性檢定。考生應先利用給定的 SXX, SYY, SXY 推導出 SSR 與 SSE,完成表格後,再依據標準 F 檢定五步驟作答,最後切記列出線性迴歸殘差的四大古典假設(常態、獨立、同質變異、線性)。
小題 (三)
承題(二),令R²₁代表解釋變數X₁對另一個解釋變數做迴歸分析得到的判定係數,j = 1,2, 且R²_1=0.65, R²_2=0.95,求出 X2之變異數膨脹因子(VIF),若 VIF 大於10代表模式有何問題?
思路引導 VIP
本題重點在於變異數膨脹因子(VIF)的定義與共線性診斷。先利用公式 VIF = 1/(1-R_j^2) 求出 X2 的 VIF 值,接著需闡述 VIF > 10 在實務上代表嚴重的多元共線性,並指出其對迴歸係數變異數膨脹及 t 檢定失效等負面影響。