地特三等申論題
108年
[統計] 迴歸分析
第 一 題
📖 題組:
在一個關於放射線對腫瘤及壽命的影響研究中,研究人員利用老鼠設計了一項為期兩年的實驗。此實驗設計 30 隻老鼠每週照射不同劑量的放射線(劑量範圍為 1~10),並記錄其壽命(單位:週)。數據形式如下表: X(劑量) 1 1 1 2 2 2 3 3 ... ... 8 8 9 9 9 10 10 10 Y(壽命) 104 104 104 104 104 98 104 94 ... ... 53 56 44 36 56 37 26 46 根據資料,研究人員完成一迴歸分析及配適圖如下:(附有R軟體輸出結果截圖) Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 3Q Max -16.745 -5.830 -1.500 5.113 22.028 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 123.3111 3.6872 33.44 < 2e-16 *** X -8.0566 0.5942 -13.56 7.95e-14 *** Residual standard error: 9.349 on 28 degrees of freedom Multiple R-squared: 0.8678
在一個關於放射線對腫瘤及壽命的影響研究中,研究人員利用老鼠設計了一項為期兩年的實驗。此實驗設計 30 隻老鼠每週照射不同劑量的放射線(劑量範圍為 1~10),並記錄其壽命(單位:週)。數據形式如下表: X(劑量) 1 1 1 2 2 2 3 3 ... ... 8 8 9 9 9 10 10 10 Y(壽命) 104 104 104 104 104 98 104 94 ... ... 53 56 44 36 56 37 26 46 根據資料,研究人員完成一迴歸分析及配適圖如下:(附有R軟體輸出結果截圖) Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 3Q Max -16.745 -5.830 -1.500 5.113 22.028 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 123.3111 3.6872 33.44 < 2e-16 *** X -8.0566 0.5942 -13.56 7.95e-14 *** Residual standard error: 9.349 on 28 degrees of freedom Multiple R-squared: 0.8678
📝 此題為申論題,共 2 小題
小題 (一)
根據分析結果,求 X 與 Y 之相關係數,完成下面之變異數分析表(ANOVA table)並說明此模型是否恰當?另,預測當 X=15 時之壽命,說明是否認同此預測值?(15 分)
思路引導 VIP
本題測驗簡單線性迴歸的報表解讀、ANOVA表重建與模型診斷。首先利用判定係數 R 平方與斜率方向求出相關係數;接著利用殘差標準誤與自由度推算 MSE 及 SSE,並藉由 t 值與 F 值的關係推導完成 ANOVA 表。最後需發揮觀察力,從散佈圖與實驗背景(為期兩年即 104 週)看出資料具「右設限 (Right-censored)」特性以評估模型適切性,並以「外推 (Extrapolation)」概念評論預測值。
小題 (二)
由於實驗時間的限制,事實上有 8 隻老鼠壽命記錄在 104 週時還是活著的狀態。試問若預算足夠而得以完整觀察所有老鼠的壽命時(如實驗時間 3 年),則迴歸分析的參數估計會如何變動(可配合圖形說明),亦即實驗數據因經費限制而對於真實之「壽命與輻射劑量關係」的分析結果可能產生怎樣的影響?(5 分)
思路引導 VIP
本題測驗「資料設限(Censoring)」對 OLS 迴歸參數估計的影響。考生應先從散佈圖中辨識出左上角(低劑量區)卡在 Y=104 的點為「右設限資料」,接著透過幾何直觀思考:若這些點的真實 Y 值變大而往上移,迴歸線會如何被拉扯?藉此推導截距與斜率的變動方向。