第 一 題
三、某研究者探討含糖飲食攝取量(公斤/年)和兒童齲齒狀況的關係,蒐集 60 個兒童之含糖飲食攝取量和恆齒齲蝕指數(為恆牙齲齒齒數、缺牙數及填補數三種牙齒數的總和,數值越小表示齲蝕顆數越少)。基本資料如下: 變數 樣本數 平均值 標準差 X和Y的樣本共變數 ∑(xi-x̄)(yi-ȳ) 糖飲食攝取量(X),單位為公斤/年 60 24.55 16.77 782.06 恆齒齲蝕指數(Y),單位為顆 60 2.34 1.59
小題 (一)
思路引導 VIP
這是一題要求計算簡單線性迴歸斜率(b1)的基本題。必須牢記斜率公式:$b_1 = \frac{SS_{xy}}{SS_{xx}}$。題目已給定交叉乘積和 $\sum(x_i-\bar{x})(y_i-\bar{y}) = 782.06$,我們只需要算出 X 的變異總和 $SS_{xx}$。已知 $s_x = 16.77$,利用公式 $SS_{xx} = (n-1) s_x^2$ 即可求得分母,進而求出 $b_1$。
小題 (二)
思路引導 VIP
此題分為兩部分:一是判斷迴歸模型的顯著性;二是解釋斜率 b1 的實質意義。判斷顯著性直接看 ANOVA 表中的 P-value (Pr > F) 即可,將其與 $\alpha$ 比較。解釋 b1 時,應套入題目的實際變數名稱與單位,說明「當 X 增加一單位時,Y 平均改變多少單位」。
小題 (三)
思路引導 VIP
決定係數即為 $R^2$。公式為 $R^2 = \frac{SSR}{SST}$ 或 $1 - \frac{SSE}{SST}$。所需數值(SSR 與 SSE)都藏在第 (二) 小題的 ANOVA 表中的「平均值平方 (Mean Square)」嗎?不是,仔細看表,表上的 36.88077 和 1.95036 是「平均值平方(MS)」,但是因為簡單迴歸的迴歸自由度為 1,所以 $MSR = SSR = 36.88077$。而 $MSE = 1.95036$,誤差自由度為 $n-2 = 58$。所以 $SSE = 1.95036 \times 58 = 113.12$。等等!請仔細觀察 ANOVA 表,F值為 18.91。若 $MSR = 36.88077$,$MSE = 1.95036$,則 $F = 36.88077 / 1.95036 = 18.9096 \approx 18.91$。這說明表上列的數字確為「平均值平方」。所以 $SSR = MSR \times 1 = 36.88077$。而 $SSE = MSE \times 58 = 1.95036 \times 58 = 113.12088$。因此 $SST = SSR + SSE = 36.88077 + 113.12088 = 150.00165$。算出 $R^2$ 後,需解釋它代表「模型可解釋的變異比例」。