第 一 題
下列是關於模式選取及模式診斷的問題。
小題 (一)
思路引導 VIP
這題考查資訊準則(Information Criteria)中 AIC 與 BIC 的轉換與模型選擇。解題關鍵在於理解 AIC 與 BIC 在懲罰項(Penalty Term)上的差異。首先,回想公式:AIC = -2 ln(L) + 2k,BIC = -2 ln(L) + k ln(n),其中 k 是估計參數個數,n 是樣本數(本題 n=13)。因此,兩者的差值為 BIC - AIC = k(ln(n) - 2)。 接著,我們必須確認題目中 k 的定義(是否包含變異數 σ^2)。利用已知完整資訊的模式 C 來反推:模式 C 有兩個解釋變數,所以迴歸係數有 β0, β2, β3 共 3 個。BIC - AIC = 52.72 - 51.03 = 1.69。若 k=3,3 × (2.56 - 2) = 3 × 0.56 = 1.68 ≈ 1.69(考慮四捨五入)。由此確認此處的 k 即為「迴歸參數個數(包含截距)」。
小題 (二)
思路引導 VIP
這是一道標準的迴歸殘差診斷題。解題核心是回憶 OLS(最小平方法)殘差的代數性質:殘差 e 與配適值 ŷ 正交(Cov(e, ŷ) = 0),殘差 e 與各解釋變數 x_j 也正交(Cov(e, x_j) = 0)。因此,將殘差對 ŷ 或對 x 畫圖,點會均勻散佈在 e=0 的水平線上下,不應有趨勢。 然而,如果把殘差 e 對「原始觀察值 y」畫圖呢?因為 y = ŷ + e,殘差 e 本身就是 y 的一部分,兩者存在正相關:Cov(y, e) = Cov(ŷ + e, e) = Cov(ŷ, e) + Var(e) = 0 + σ^2 > 0。因此,e 對 y 的圖會呈現一條從左下到右上的正斜率趨勢線,這無法用來客觀診斷等變異數性(Homoscedasticity)或模型適當性,是不適當的殘差圖。另外,(5) 對時間 i 畫圖是為了檢驗殘差是否有自相關(Autocorrelation),是時間序列橫斷面資料常見且合理的診斷。找出(3)並說明正相關原因是拿分的關鍵。
小題 (三)
思路引導 VIP
看到這題應先想到如何設定「虛擬變數(Dummy Variables)」來建立類別變數的多元迴歸模型。接著,透過最小平方法(OLS)求出迴歸係數與 MSE,並利用推導出的標準誤代入信賴區間公式進行區間估計,最後釐清 ANOVA 總體 F 檢定的統計意義。