高考申論題
107年
[衛生行政] 生物統計學(含流行病學)
第 五 題
📖 題組:
某研究探討青少年血液總膽固醇(T-chol)與舒張壓(DBP)之關係,並考慮性別(Sex)、年齡(Age)、三酸甘油脂(TG)、收縮壓(SBP)對兩者之關係的作用。分析數據顯示於下,請回答下列問題?(相關統計數據與矩陣見題目圖片)
某研究探討青少年血液總膽固醇(T-chol)與舒張壓(DBP)之關係,並考慮性別(Sex)、年齡(Age)、三酸甘油脂(TG)、收縮壓(SBP)對兩者之關係的作用。分析數據顯示於下,請回答下列問題?(相關統計數據與矩陣見題目圖片)
📝 此題為申論題,共 5 小題
小題 (五)
模式 2 之中,每增加 2 mmHg 之舒張壓與 1 mmHg 之收縮壓,總膽固醇平均變化量之 95%信賴區間為何?(5 分)
思路引導 VIP
看到題目要求計算「多個自變數同時變動」造成的應變數變化,應立刻想到這是求迴歸係數「線性組合」的區間估計。必須從題目提供的「共變數矩陣」中擷取出變異數與共變異數,代入線性組合變異數公式 $Var(aX+bY) = a^2Var(X) + b^2Var(Y) + 2abCov(X,Y)$ 求得標準誤,再搭配 Z 分數推導 95% 信賴區間。
小題 (一)
若要由總膽固醇來預測腎絲球過濾率請以上述數據作散布圖(scatter diagram)。(5 分)
思路引導 VIP
本題測試考生繪圖的基本功。重點是誰是 X 軸、誰是 Y 軸。「由 A 來預測 B」,代表 A 是自變數 (X),B 是依變數 (Y)。因此總膽固醇 TCHOL 是 X 軸,腎絲球過濾率 eGFR 是 Y 軸。畫圖時要標明軸線名稱及數值刻度,並將 8 個座標點 $(X_i, Y_i)$ 大致點對位置即可。
小題 (二)
求由總膽固醇預測腎絲球過濾率的迴歸係數,請說明得到數值的意義。(10 分)
思路引導 VIP
這題要求計算簡單線性迴歸的斜率 $\beta_1$。公式為 $\hat{\beta}1 = SS{XY} / SS_{XX}$。必須先踏實地算出 $\Sigma X, \Sigma Y, \Sigma X^2, \Sigma XY$,然後求出平分和離均差交乘和。計算出係數後,一定要回答「意義」:即 X 每增加 1 單位,Y 平均改變多少單位。
小題 (三)
檢驗迴歸係數是否為 0。(10 分)
思路引導 VIP
檢定迴歸斜率 $\beta_1 = 0$ 有兩種主流方法:使用 t 檢定或使用變異數分析 (ANOVA F檢定)。兩者結論必同。此處若用 t 檢定,需先算出殘差變異數 (MSE) 及斜率的標準誤 $SE(\hat{\beta}1)$。步驟:1. 算 $SS{YY}$。2. 算 $SSR$ 和 $SSE$。3. 算 $MSE$。4. 算 $t = \hat{\beta}_1 / SE(\hat{\beta}_1)$。5. 查 t 表或 F 表比較。
小題 (四)
由變數之間的相關係數矩陣判斷,那個變數對總膽固醇與舒張壓之間的相關性具有最大的干擾作用,理由為何?(5 分)
思路引導 VIP
- 判斷干擾作用需回顧流行病學中「干擾因子(Confounder)」的核心條件:該變數必須同時與自變數(此為舒張壓 DBP)及依變數(此為總膽固醇 T-chol)具有統計上的顯著相關。
- 檢視題目提供的「變數之間的相關係數矩陣」,逐一比對各潛在變數(TG, SBP, Age, Sex)與 DBP 和 T-chol 的相關係數 (r) 及其 p 值,找出同時顯著相關者即為具最大干擾作用的變數。