高考申論題
112年
[統計] 迴歸分析
第 一 題
📖 題組:
某資料有 40 個觀察值,因變數為 $y_1,...,y_{40}$,自變數為 $x_1,...,x_{40}$,迴歸模式 $y_i = \beta_0 + \beta_1 x_i + \epsilon_i$。 (一)其檢定之有效性是建立在對 $\epsilon_i$ 的那些假設下?(10 分) (二)若 $(x_1,...,x_{20})$ 為男生體重,$(x_{21},...,x_{40})$ 為女生體重,$y$ 為其運動後心跳頻率。已知男生體重的變異量一般較女生大。今以 $y$ 對 $x$ 做簡單線性迴歸,可能會違反(一)中那些假設?(5 分) (三)若 $x_1,...,x_{10}$ 是 10 個人第 1 年之測量值,$x_{11},...,x_{20}$ 為其第 2 年測量值,$x_{21},...,x_{30}$ 為其第 3 年測量值,$x_{31},...,x_{40}$ 為其第 4 年測量值。以 $y$ 對 $x$ 做簡單線性迴歸的話,會違反(一)中那些假設?(5 分)
某資料有 40 個觀察值,因變數為 $y_1,...,y_{40}$,自變數為 $x_1,...,x_{40}$,迴歸模式 $y_i = \beta_0 + \beta_1 x_i + \epsilon_i$。 (一)其檢定之有效性是建立在對 $\epsilon_i$ 的那些假設下?(10 分) (二)若 $(x_1,...,x_{20})$ 為男生體重,$(x_{21},...,x_{40})$ 為女生體重,$y$ 為其運動後心跳頻率。已知男生體重的變異量一般較女生大。今以 $y$ 對 $x$ 做簡單線性迴歸,可能會違反(一)中那些假設?(5 分) (三)若 $x_1,...,x_{10}$ 是 10 個人第 1 年之測量值,$x_{11},...,x_{20}$ 為其第 2 年測量值,$x_{21},...,x_{30}$ 為其第 3 年測量值,$x_{31},...,x_{40}$ 為其第 4 年測量值。以 $y$ 對 $x$ 做簡單線性迴歸的話,會違反(一)中那些假設?(5 分)
📝 此題為申論題,共 3 小題
小題 (一)
其檢定之有效性是建立在對 $\epsilon_i$ 的那些假設下?(10 分)
思路引導 VIP
看到「檢定之有效性」,應立刻聯想到古典線性迴歸模型對誤差項 $\epsilon_i$ 的四大基本假設(期望值為零、變異數同質性、獨立性、常態性)。特別注意,因題目強調「檢定」而非僅「估計」,故除高斯-馬可夫定理所需假設外,務必點出「常態分配假設」,此為推導 t 檢定與 F 檢定統計量的數學基礎。
小題 (二)
若 $(x_1,...,x_{20})$ 為男生體重,$(x_{21},...,x_{40})$ 為女生體重,$y$ 為其運動後心跳頻率。已知男生體重的變異量一般較女生大。今以 $y$ 對 $x$ 做簡單線性迴歸,可能會違反(一)中那些假設?(5 分)
思路引導 VIP
考生看到此題應敏銳察覺樣本實質上來自兩個不同母體(男與女),且題目明示自變數(體重)在兩群體間變異量不同。這強烈暗示著依變數(心跳)的殘差變異數極可能隨群體改變,應直指「違反變異數同質性」;同時,應思考未控制性別變數可能導致模型設定偏誤,使殘差吸收了群體差異,導致誤差項期望值不為零。
小題 (三)
若 $x_1,...,x_{10}$ 是 10 個人第 1 年之測量值,$x_{11},...,x_{20}$ 為其第 2 年測量值,$x_{21},...,x_{30}$ 為其第 3 年測量值,$x_{31},...,x_{40}$ 為其第 4 年測量值。以 $y$ 對 $x$ 做簡單線性迴歸的話,會違反(一)中那些假設?(5 分)
思路引導 VIP
考生應先辨識出這是一組「重複測量資料(Repeated Measures)」或「追蹤資料」。同一個受測者在連續四年的資料必然帶有個人特質的延續性,這會直接破壞誤差項必須「相互獨立」的古典假設。