高考申論題
111年
[統計] 迴歸分析
第 三 題
📖 題組:
一位統計分析師受託分析 20 名年齡 40~60 歲高血壓患者的血壓相關數據,以評估可能影響血壓的重要因素,資料描述如下: 血壓(Y,反應變數,以 mm Hg 為單位),年齡(X1,以年為單位),重量(X2,公斤),體表面積(X3,平方公尺),高血壓病史(X4,以年為單位),基礎脈搏(X5,以每分鐘為單位),壓力指數(X6,0−100 為範圍)。部分統計套裝軟體輸出結果在表 2 和表 3。 表2 反應變數 | 5個解釋變數 | 判定係數 R² X1 | X2-X6 | 0.451 X2 | X1, X3-X6 | 0.925 X3 | X1-X2, X4-X6| 0.905 X4 | X1-X3, X5-X6| 0.196 X5 | X1-X4, X6 | 0.754 X6 | X1-X5 | 0.416 表3 解釋變數 | Type I SS | 偏判定係數 X1 | SSR(X1) 243.266 | R²_{Y,X1} 0.4344 X2 | SSR(X2|X1) 306.886 | R²_{Y,X2|X1} 0.96891 X3 | SSR(X3|X1,X2) 0.765 | R²_{Y,X3|X1,X2} 0.07763 X4 | SSR(X4|X1,X2,X3) 0.250 | R²_{Y,X4|X1,X2,X3} 0.02755 X5 | SSR(X5|X1,X2,X3,X4) 0.965 | R²_{Y,X5|X1,X2,X3,X4} 0.1092 X6 | SSR(X6|X1,X2,X3,X4,X5) 1.023E-04 | R²_{Y,X6|X1,X2,X3,X4,X5} 1.3E-05
一位統計分析師受託分析 20 名年齡 40~60 歲高血壓患者的血壓相關數據,以評估可能影響血壓的重要因素,資料描述如下: 血壓(Y,反應變數,以 mm Hg 為單位),年齡(X1,以年為單位),重量(X2,公斤),體表面積(X3,平方公尺),高血壓病史(X4,以年為單位),基礎脈搏(X5,以每分鐘為單位),壓力指數(X6,0−100 為範圍)。部分統計套裝軟體輸出結果在表 2 和表 3。 表2 反應變數 | 5個解釋變數 | 判定係數 R² X1 | X2-X6 | 0.451 X2 | X1, X3-X6 | 0.925 X3 | X1-X2, X4-X6| 0.905 X4 | X1-X3, X5-X6| 0.196 X5 | X1-X4, X6 | 0.754 X6 | X1-X5 | 0.416 表3 解釋變數 | Type I SS | 偏判定係數 X1 | SSR(X1) 243.266 | R²_{Y,X1} 0.4344 X2 | SSR(X2|X1) 306.886 | R²_{Y,X2|X1} 0.96891 X3 | SSR(X3|X1,X2) 0.765 | R²_{Y,X3|X1,X2} 0.07763 X4 | SSR(X4|X1,X2,X3) 0.250 | R²_{Y,X4|X1,X2,X3} 0.02755 X5 | SSR(X5|X1,X2,X3,X4) 0.965 | R²_{Y,X5|X1,X2,X3,X4} 0.1092 X6 | SSR(X6|X1,X2,X3,X4,X5) 1.023E-04 | R²_{Y,X6|X1,X2,X3,X4,X5} 1.3E-05
📝 此題為申論題,共 3 小題
小題 (三)
請利用表 3 結果及 SST=560,SSR(X1,X2,X5)=551.568,計算 SSR(X5|X1,X2)和偏判斷係數R²_{Y,X5|X1,X2}。(10 分)
思路引導 VIP
解題核心在於利用 Type I SS 的加法性質(Sequential SS)。先透過 SSR(X1,X2,X5) 減去表中的 SSR(X1) 及 SSR(X2|X1) 求得額外迴歸平方和 SSR(X5|X1,X2)。接著,利用總變異 SST 扣除 SSR(X1,X2) 算出殘差平方和 SSE(X1,X2),兩者相除即為偏判定係數。
小題 (一)
請寫出 ANOVA 表中(1)至(16)的值。(16 分)
思路引導 VIP
這題是標準的逐步解謎。關鍵在於理解 ANOVA 表的結構與 Type I SS (Sequential Sum of Squares)。
- 自由度 (df):Total = n - 1 = 29,推得 n = 30。模型有 3 個自變數 (X1, X2, X3),所以個別變數的 df 都為 1 ((2)=1, (3)=1, (4)=1)。迴歸總 df (1) = 1+1+1 = 3。Error df (5) = Total - Reg = 29 - 3 = 26。
小題 (二)
在顯著水準為 0.05 下,詳述 ANOVA 表中(13)至(16)所提供之檢定的意義與結果。(14 分)
思路引導 VIP
這題要求解釋各 F 值的檢定意義與結論。這依賴於對「額外平方和(Extra Sum of Squares)」的理解。
- (13) 是全模型的 F 檢定。檢定所有解釋變數是否聯合顯著。H0: β1 = β2 = β3 = 0。需查 F(3, 26) 臨界值。