高考申論題
107年
[統計] 迴歸分析
第 一 題
下表為 2012 年時 19 個縣市的資料,若以粗出生率為反應變數 Y,四個解釋變數分別為勞動力參與率(X1)、就業者之教育程度結構-大專及以上(X2)、老化指數(X3)、平均每人環保經費(X4)。(資料表、變數間相關係數矩陣、散布圖、模型估計結果與模型選取準則表如原卷所示)
一、若由 Y 與 X3 的散布圖判斷,該圖中可能有一個離群值。請將該離群值排除後,重新計算 Y 與 X3 相關係數。(10 分)
📝 此題為申論題
思路引導 VIP
看到本題,首先要將視覺上的散布圖與原始資料表進行對照。從 Y 與 X3 的散布圖中,可發現有一點的 Y 值特別高(接近 13),且對應的 X3 值偏低(約 50 左右)。對照資料表,可辨識出該離群值為「新竹市」(Y=12.85, X3=50.40)。接著,考點在於「排除該點後重新計算相關係數」。由於考試允許使用計算機,考生不需要徒手進行繁雜的平方和計算,只需將剔除新竹市後的 18 筆 (X3, Y) 資料輸入工程計算機的統計模式,即可得出新的皮爾森相關係數。
🤖
AI 詳解
AI 專屬家教
【考點分析】 本題考查散布圖的判讀、離群值(Outlier)的辨識,以及皮爾森相關係數(Pearson Correlation Coefficient)的計算。 【理論/公式依據】
▼ 還有更多解析內容