免費開始練習
普考申論題 114年 [衛生行政] 流行病學與生物統計學概要

第 一 題

📖 題組:
五、一項旨在探討美國飲食中添加燕麥所產生效果的研究中,20 位受試者被隨機分為兩組。第一組每天兩次以燕麥替代其他含碳水化合物的食物;第二組則維持原有飲食習慣,不做任何改變。研究的主要觀察指標之一是每位受試者在研究開始八週後的血清膽固醇水平。可能影響此反應變數的解釋變數包括:所屬飲食組別、研究開始時的血清膽固醇水平、身體質量指數(BMI)以及性別。下表展示了包含這四個解釋變數的多元迴歸模型中的迴歸係數與標準誤。(每小題 5 分,共 25 分) (表略:飲食組別 b=-11.25, SE=4.33; 初始膽固醇 b=0.85, SE=0.07; BMI b=0.23, SE=0.65; 性別 b=-3.02, SE=4.42) (備註:$t_{1,0.975} = 12.706$,$t_{2,0.975} = 4.303$,$t_{3,0.975} = 3.182$,$t_{4,0.975} = 2.776$,$t_{4,0.95} = 2.132$,$t_{15,0.975} = 2.131$,$t_{15,0.95} = 1.753$,$t_{16,0.975} = 2.120$)
📝 此題為申論題,共 5 小題

小題 (一)

假設複迴歸方程式中四個解釋變數的係數均為 0,在 0.05 的顯著水準下,那些變項對研究開始八週後的血清膽固醇濃度有影響?

思路引導 VIP

考生首先需判斷這是在進行多元迴歸模型的個別係數顯著性檢定(t檢定)。利用公式 t = b / SE 計算各變數的檢定統計量,並正確推導自由度 df = n - k - 1 = 15,再與題目提供的臨界值 t(15,0.975) 比較,絕對值大於臨界值者即為具有顯著影響的變項。

🤖
AI 詳解
AI 專屬家教

【解題思路】透過個別迴歸係數的 t 檢定(t = b / SE)來判斷各解釋變數是否對依變數有顯著影響,並利用樣本數計算正確的自由度尋找臨界值。 【詳解】 一、建立假說:

小題 (二)

若研究開始時的血清膽固醇增加 1 單位,其他解釋變數不變情況下,八週後血清膽固醇水平會發生什麼變化?

思路引導 VIP

本題測驗考生對多元線性迴歸模型中迴歸係數(β)的解讀能力。看到此類題目,應直覺聯想迴歸係數的定義:在控制其他共變數不變的情況下,自變數每增加1單位,依變數的平均變化量,並結合題幹給定的數值直接作答。

🤖
AI 詳解
AI 專屬家教

【解題思路】運用多元線性迴歸模型中連續型變數迴歸係數(β)的統計定義進行數值解釋,並說明其在研究設計中的流行病學意義。 【詳解】 一、統計定義與數值解析

小題 (三)

若研究開始時的血清膽固醇增加 10 單位,其他解釋變數不變情況下,八週後血清膽固醇水平會發生什麼變化?

思路引導 VIP

本題測驗考生對多元線性迴歸係數含義的理解。看到「其他變數不變」及「自變數增加若干單位」,應直接對應尋找該變數的迴歸係數,並將迴歸係數與增加的單位數相乘,即可得出依變數的平均變化量。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】多元線性迴歸模型中,連續型自變數迴歸係數的統計意義與計算。 【解答】 計算:

小題 (四)

指標變數性別的編碼為 1 代表男性,0 代表女性。研究開始八週後,男性和女性中,誰的血清膽固醇水平更有可能升高?平均而言,會高出多少?

思路引導 VIP

看到這題,首先應聚焦於迴歸模型中「性別」變項的編碼定義(1=男,0=女)與其對應的迴歸係數(b = -3.02)。透過代入虛擬變數(Dummy Variable)的概念,比較兩者在控制其他變數下的期望值差異,即可判斷哪一性別的血清膽固醇數值較高以及其平均相差多少。

🤖
AI 詳解
AI 專屬家教

【解題思路】透過檢視多元迴歸模型中「性別」變項的編碼定義與迴歸係數,判斷在控制其他干擾因子下,性別對八週後血清膽固醇水平的平均影響。 【詳解】 已知條件:

小題 (五)

假設此多元迴歸模式之迴歸平方和為 128,研究開始八週後的血清膽固醇濃度的變異數為 20,請計算決定係數。

思路引導 VIP

看到計算決定係數(R²),應立刻聯想其公式為迴歸平方和(SSR)除以總平方和(SST)。題目已給定SSR,而SST可透過反應變數的樣本變異數乘以自由度(n-1)轉換求得,按部就班代入數值即可解出。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】決定係數 $R^2$ 的公式為迴歸平方和(SSR)除以總平方和(SST),而總平方和可由反應變數的樣本變異數乘以自由度 $(n-1)$ 推導求得。 【解答】 計算:

升級 VIP 解鎖