高考申論題
110年
[統計] 迴歸分析
第 一 題
📖 題組:
某研究團隊隨機觀察兩歲內男童的月齡(Month)與體重(weight)的數據共 125 筆,0~24 月齡各 5 筆。月齡 vs 體重的散布圖如下。研究團隊考慮以月齡的 4 次多項式迴歸模式來預測體重。預測變數為中心化月齡(x = Month_c = Month − mean (Month)),考慮一~四次多項式模式,如下: M1: weight = β0 + β1x + ε M2: weight = β0 + β1x + β2x^2 + ε M3: weight = β0 + β1x + β2x^2 + β3x^3 + ε M4: weight = β0 + β1x + β2x^2 + β3x^3 + β4x^4 + ε 各模式的變異數分析表及係數表如題目所示。
某研究團隊隨機觀察兩歲內男童的月齡(Month)與體重(weight)的數據共 125 筆,0~24 月齡各 5 筆。月齡 vs 體重的散布圖如下。研究團隊考慮以月齡的 4 次多項式迴歸模式來預測體重。預測變數為中心化月齡(x = Month_c = Month − mean (Month)),考慮一~四次多項式模式,如下: M1: weight = β0 + β1x + ε M2: weight = β0 + β1x + β2x^2 + ε M3: weight = β0 + β1x + β2x^2 + β3x^3 + ε M4: weight = β0 + β1x + β2x^2 + β3x^3 + β4x^4 + ε 各模式的變異數分析表及係數表如題目所示。
📝 此題為申論題,共 3 小題
小題 (一)
在 5%的顯著水準下,請依序檢定下列虛無假說,H02:β2 = β3 = β4 = 0、H03:β3 = β4 = 0、H04:β4 = 0,直到不拒絕H0i,以確定多項式迴歸模式的最高次為何。(30 分)(提示:若拒絕 H0i, for all i ≤ a,且不拒絕 H0i, for all i > a,則多項式模式最高次為a)
思路引導 VIP
遇到多項式迴歸最高次項決定的問題,應使用「部分 F 檢定(Partial F-test)」來比較全模型與各縮減模型。透過計算各模型的殘差平方和(SSE)差異,並以全模型的均方誤差(MSE)為分母,逐步檢定高次項聯合係數是否為零;當檢定結果拒絕虛無假說時,代表該高次項具有顯著解釋力。
小題 (二)
請根據上述結果寫出多項式預測模式,並預測月齡為 10 月的男童體重,假設月齡為 10 月的男童體重估計變異數為 $s^2(\hat{Y}) = 0.298$,請求出該男童體重的 95%預測區間。(15 分)
思路引導 VIP
本題測驗多項式迴歸模型的選擇與預測區間的計算。首先觀察係數表,M4 的最高次項(四次項)顯著,基於階層性原則應選 M4。接著需計算中心化月齡代入求出點估計值。最後,最關鍵的是區分『預測區間』與『信賴區間』,預測新觀測值的變異數需加上模型本身的殘差變異數(MSE),即 s²_pred = MSE + s²(Ŷ)。
小題 (三)
由於每個月齡都有 5 筆資料,純誤差平方和(pure error sum of square, SSPE)為 25.54,請根據(一)的結果,在 5%的顯著水準下,完成該模式適合度檢定(test for lack of fit)。(15 分)
思路引導 VIP
這題測驗「適合度檢定」(Lack of Fit Test) 的核心觀念。看到題目給定『純誤差平方和 (SSPE)』及『每個 X 都有多筆重複資料』,就應立刻聯想到將殘差平方和 (SSE) 分解為:SSE = SSPE + SSLF (不適合度平方和)。接著計算 MSLF 與 MSPE 並建構 F 統計量,與臨界值比較後,即可判斷模型是否配適良好。
📜 參考法條
F分配的百分位點表
t分配表