地特三等申論題
109年
[統計] 迴歸分析
第 一 題
📖 題組:
一位主管欲知道碩士級分析師的月薪是否可以用年資來預測,以作為未來給薪的參考。他收集了30個樣本觀察值,資料包含年資(X,以年為單位)和月薪(Y,以千元為單位)。請依據下面數據和圖1回答問題。 \(\bar{X} = 5.34, \bar{Y} = 76, S_{XY} = \sum(X_i - \bar{X})(Y_i - \bar{Y}) = 2198,\) \(S_{XX} = \sum(X_i - \bar{X})^2 = 232.072, S_{YY} = \sum(Y_i - \bar{Y})^2 = 21890\)
一位主管欲知道碩士級分析師的月薪是否可以用年資來預測,以作為未來給薪的參考。他收集了30個樣本觀察值,資料包含年資(X,以年為單位)和月薪(Y,以千元為單位)。請依據下面數據和圖1回答問題。 \(\bar{X} = 5.34, \bar{Y} = 76, S_{XY} = \sum(X_i - \bar{X})(Y_i - \bar{Y}) = 2198,\) \(S_{XX} = \sum(X_i - \bar{X})^2 = 232.072, S_{YY} = \sum(Y_i - \bar{Y})^2 = 21890\)
📝 此題為申論題,共 3 小題
小題 (一)
在配適 Y_i = $\beta_0 + \beta_1 X_i + \varepsilon_i$的簡單線性迴歸方程式下,請利用最小平方法計算參數 $\beta_0$和 $\beta_1$估計值(estimates)。如果將模型改為 Y_i = $\alpha + \beta_1(X_i - \bar{X}) + \varepsilon_i$,請寫出參數 $\alpha$和 $\beta_1$最小平方估計式(least-squares estimators)及其估計標準誤(standard errors)。(12分)
思路引導 VIP
首先運用最小平方法公式求出斜率 $\beta_1$,再利用通過樣本平均數點的特性求得截距 $\beta_0$。接著處理中心化模型,理解自變數離均差化後,截距項 $\alpha$ 的估計式即為 $\bar{Y}$,代入殘差平方和 (SSE) 計算均方誤差 (MSE) 後,即可求出兩參數的估計標準誤。題意要求「估計式」與「標準誤」,建議同時列出公式與數值解答以策安全。
小題 (二)
假設 Y_i ~ N($\beta_0 + \beta_1 X_i, \sigma^2)$,請在顯著水準 $\alpha = 0.05$下,檢定 H_0: $\beta_1 = 0$。請試述檢定統計量之值、決策法則和結論。請寫出在應用最大概似估計(Maximum likelihood estimation)法,$\sigma^2$的估計值。請寫出利用最小平方法,$\sigma^2$的估計值。(10分)
思路引導 VIP
考生看到本題應先利用給定的離均差平方和 (Sxx, Syy) 及交叉乘積和 (Sxy) 計算迴歸斜率估計值與變異數分解 (SST, SSR, SSE)。取得 SSE 後,即可推導出 MSE 以進行斜率的 t 檢定或 F 檢定,並運用自由度的觀念區分變異數 σ² 的最大概似估計(除以 n)與最小平方不偏估計(除以 n-2)。
小題 (三)
請問年資是5年的碩士級分析師之平均薪資的95%信賴區間。(4分)
思路引導 VIP
看到求特定 X 條件下的「平均薪資的信賴區間」,需立刻聯想到這是求「平均反應值 (Mean Response) 的信賴區間 (CI)」,而非「單一個體預測區間 (PI)」。解題步驟應依序求出:迴歸斜率與截距、特定點預測值 $\hat{Y}0$、誤差變異數 $MSE$,最後代入標準誤公式 $SE = \sqrt{MSE(\frac{1}{n} + \frac{(X_0-\bar{X})^2}{S{XX}})}$ 並搭配 t 分配臨界值求解。
📜 參考法條
參考之查表值:F 分布 \alpha=0.05 臨界值 F_{0.05}(df1, df2)
df1: 1, 2
df2: 27 -> 4.2100, 3.3541
df2: 28 -> 4.1960, 3.3404
df2: 402 -> 3.8647, 3.0182
df2: 403 -> 3.8646, 3.0181
t_{0.025}(28)=-2.0484, t_{0.025}(30)=-2.0422