普考申論題
112年
[經建行政] 統計學概要
第 四 題
📖 題組:
保護動物協會想根據某型寵物犬成犬的體重(自變數 X),預測其 3 年內的就醫次數(因變數 Y),所蒐集到的資料如下:n = 8, $\sum_{i=1}^{n} x_i = 40$, $\sum_{i=1}^{n} y_i = 84$, $\sum_{i=1}^{n} x_i^2 = 210$, $\sum_{i=1}^{n} y_i^2 = 980$, $\sum_{i=1}^{n} x_i y_i = 390$。
保護動物協會想根據某型寵物犬成犬的體重(自變數 X),預測其 3 年內的就醫次數(因變數 Y),所蒐集到的資料如下:n = 8, $\sum_{i=1}^{n} x_i = 40$, $\sum_{i=1}^{n} y_i = 84$, $\sum_{i=1}^{n} x_i^2 = 210$, $\sum_{i=1}^{n} y_i^2 = 980$, $\sum_{i=1}^{n} x_i y_i = 390$。
📝 此題為申論題,共 5 小題
小題 (四)
試求迴歸方程式。
思路引導 VIP
遇到求迴歸方程式的題型,首要任務是確立最小平方法(OLS)的估計公式。應先依序計算出樣本平均數(x̄, ȳ),接著代入公式求出離均差平方和(SSxx)與交乘和(SSxy),最後推導出斜率與截距。步驟必須嚴謹,以免計算錯誤導致後續相關係數或變異數分析全盤皆錯。
小題 (一)
試分別計算 X 和 Y 的樣本標準差。
思路引導 VIP
看到這題,首先確認題目明確要求計算「樣本」標準差,因此計算變異數時分母必須使用自由度 (n-1),切勿用母體變異數的 n。解題關鍵在於熟練運用快捷公式計算離均差平方和(如 SS_xx),求出變異數後再開平方根即可。
小題 (二)
試分別計算 X 和 Y 的變異係數。
思路引導 VIP
看到「變異係數(CV)」題型,應立即聯想其定義公式為「標準差除以平均數」。利用題目給定的平方和與總和資料,先分別計算出 X 和 Y 的樣本平均數與樣本標準差,最後代入 CV 公式求解並轉為百分比表示。
小題 (三)
欲判斷 X 和 Y 何者變化較大,建議使用標準差或變異係數?請說明理由。
思路引導 VIP
看到比較兩組資料「變化大小(變異程度)」時,首先要注意兩者的「單位」與「平均數」是否相同。若單位不同(如體重與次數)或平均數差異大,絕對不能直接比較標準差,必須計算並使用「變異係數 (Coefficient of Variation, CV)」來衡量相對變異程度。
小題 (五)
令x 與 y 為樣本平均,試說明迴歸線必通過( x, y ) 。
思路引導 VIP
看到證明「迴歸線必通過樣本平均點」,應直覺聯想到利用「最小平方法(OLS)」的正規方程式。透過將誤差平方和對截距項偏微分並令其為零,即可推導出 $\bar{y} = \hat{\beta}_0 + \hat{\beta}_1 \bar{x}$ 的關係式,從而得證此為普適的數學性質,無需代入題幹數值計算。
簡單線性迴歸分析
💡 利用最小平方法求得自變數與因變數間的最佳直線關係。
🔗 最小平方法(OLS)估計步驟
- 1 計算平均值 — 計算出 X 與 Y 的樣本平均數。
- 2 計算離均差和 — 算出 SSxx 與 SSxy 的關鍵統計量。
- 3 求斜率與截距 — 斜率 = SSxy / SSxx,再代入平均求截距。
- 4 寫出方程式 — 組合係數寫成 y = a + bx 的估計式。
↓
↓
↓
🔄 延伸學習:延伸學習:模型配適度(R2)評估與殘差分析。