免費開始練習
高考申論題 106年 [統計] 迴歸分析

第 一 題

📖 題組:
一位數據分析師受冰飲企業老闆的委託,欲知道每日最高溫和該公司冰品銷售是否有線性關係,以作為未來商品促銷的依據。他蒐集了每日最高溫(X,以攝氏為單位)和冰品銷售(Y),共 30 個樣本點。下列是這些數據的統計量: n = 30, X_bar = 28.9892,Y_bar = 34.7065,SXY = 360.2128 SXX = 556.0186,SYY = 353.0085 (一)在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分) (二)請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分) Source | Sum of Squares | DF | Mean square | F value Regression | (1) | (4) | | Error | (2) | (5) | (6) | Total | (3) | | |
📝 此題為申論題,共 3 小題

小題 (一)

在配適 E(Y|X=x) = α + β1(x - X_bar) 的簡單線性迴歸方程式下,請利用最小平方法計算參數估計值(α^ 和 β1^)與分別之標準誤。並請試述 α^ 和 β1^ 的共變異數,也就是 Cov(α^, β1^)。(15 分)

思路引導 VIP

看到模型中的自變數採用平移後的型式 $(x - \bar{x})$,應立刻聯想到「中心化」簡單線性迴歸。此模型的特性在於截距項就是 $Y$ 的樣本平均數,且截距項與斜率項的估計值互不相關(共變異數為 0),接著透過給定的 SS 統計量算出估計值、SSE 及 MSE 後,再套用標準誤公式即可解題。

🤖
AI 詳解
AI 專屬家教

【解題思路】由於迴歸模型使用平移後的自變數 $(x - \bar{x})$,此為中心化的簡單線性迴歸模型。可直接利用 OLS 公式求得參數估計值,並推導均方誤差(MSE)以計算標準誤,同時根據正交性質說明兩參數之共變異數。 【詳解】 已知:

小題 (二)

請在試卷上,完成下列變異數分析表。在顯著水準 α=0.05,請協助檢定H0: β1 = 0。並請試述檢定統計量之值、決策法則、結論和所需要之假設。(10 分) Source | Sum of Squares | DF | Mean square | F value Regression | (1) | (4) | | Error | (2) | (5) | (6) | Total | (3) | | |

思路引導 VIP

本題測驗核心為建構變異數分析表(ANOVA Table)與進行整體模型顯著性檢定。考生應先利用給定的 SXX, SYY, SXY 推導出 SSR 與 SSE,完成表格後,再依據標準 F 檢定五步驟作答,最後切記列出線性迴歸殘差的四大古典假設(常態、獨立、同質變異、線性)。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】利用給定之變異數與共變異數推算迴歸平方和(SSR)與總平方和(SST),進而建構 ANOVA 表並執行 F 檢定;同時需點出線性迴歸誤差項的四大基本假設。 【解答】 計算:

小題 (三)

承題(二),令R²₁代表解釋變數X₁對另一個解釋變數做迴歸分析得到的判定係數,j = 1,2, 且R²_1=0.65, R²_2=0.95,求出 X2之變異數膨脹因子(VIF),若 VIF 大於10代表模式有何問題?

思路引導 VIP

本題重點在於變異數膨脹因子(VIF)的定義與共線性診斷。先利用公式 VIF = 1/(1-R_j^2) 求出 X2 的 VIF 值,接著需闡述 VIF > 10 在實務上代表嚴重的多元共線性,並指出其對迴歸係數變異數膨脹及 t 檢定失效等負面影響。

🤖
AI 詳解
AI 專屬家教

【解題思路】利用變異數膨脹因子(VIF)定義公式進行計算,並結合共線性(Multicollinearity)診斷準則解釋其統計意涵。 【詳解】 已知:$R^2_2$ 代表解釋變數 $X_2$ 對其他解釋變數(即 $X_1, X_3$)做輔助迴歸分析得到的判定係數,依題意 $R^2_2 = 0.95$。

📝 同份考卷的其他題目

查看 106年[統計] 迴歸分析 全題

升級 VIP 解鎖