免費開始練習
高考申論題 108年 [統計] 迴歸分析

第 一 題

📖 題組:
註:所有計算至小數點第 2 位。
📝 此題為申論題,共 4 小題

小題 (一)

考慮下列涉及 3 條可能不同截距但相同斜率之直線的簡單線性迴歸模式: y1i = β01 + β1x1i + ϵ1i, y2i = β02 + β1x2i + ϵ2i, y3i = 1 + β1x3i + ϵ3i, i = 1, ⋯ , n, 其中ϵ11,..,ϵ1n, ϵ21,..,ϵ2n, ϵ31,..,ϵ3n為彼此獨立且期望值為0而變異數皆為σ^2的隨機誤差。請利用上述所有資料求出β01, β02, β1的最小平方估計量(least squares estimator)(β_01) ̂, (β_02) ̂, (β_1) ̂及(β_1) ̂的變異數Var((β_1) ̂)。(10 分)

思路引導 VIP

看到這題,首先要辨識出這是一個「共用斜率參數,但各組截距設定不同」的聯合迴歸(Pooled Regression)問題。思考時不要把三條線分開獨立估計,而是應該把它們「堆疊(Stack)」成一個大的矩陣形式 Y* = Xβ + ϵ。特別注意第三條線的截距是「常數 1」而不是未知參數,所以要把 1 移到等式左邊,當作已知的反應變數平移。在建構設計矩陣 X* 時,應該包含三個行向量:第一組的虛擬變數、第二組的虛擬變數、以及全部的 x 值。接著利用正規方程式 (X^T X)^(-1) X^T Y 即可聯立求解。推導變異數時,要小心第三組的 X 是沒有中心化(未減去平均數)的,這是一個大陷阱!

🤖
AI 詳解
AI 專屬家教

【考點分析】 本題測驗考生對於矩陣形式最小平方估計量(OLS Estimator)的推導能力,以及如何處理帶有部分已知參數(第三組截距為1)的虛擬變數迴歸模型,重點在於設計矩陣(Design Matrix)的正確建構與變異數分析。 【理論/法規依據】

小題 (二)

某國政府統計分析師利用迴歸方法分析該國經濟狀況的評估分數Y以及影響該國經濟狀況之重要指數X,其所用之模式為 Y = β0 + β1X + ϵ,其中隨機誤差ϵ有下列之機率密度函數表達:f(x) = e^x / (1 + e^x)^2 , -∞ < x < ∞。當Y值大於0時,則該國的經濟評估為正向發展;反之即為負向發展。考慮另一變數 Q,當Y>0,則 Q=1,反之當Y≤0,則 Q=0,即 Q 為該國經濟是否為正向發展的指標。試求出一函數 h 使得 h(μ) = β0+β1X,其中μ = E(Q)為 Q 的期望值。(10 分)

思路引導 VIP

這是一道引導推導「羅吉斯迴歸(Logistic Regression)」連結函數(Link Function)的經典題型。首先,釐清 Q 是一個伯努利(Bernoulli)隨機變數(0 或 1),所以 E(Q) = P(Q=1) = P(Y>0)。接著,將 Y 的模式代入 P(Y>0),即 P(β0 + β1X + ϵ > 0) = P(ϵ > -β0 - β1X)。觀察題目給的誤差項 ϵ 的 PDF,這是標準羅吉斯分配(Standard Logistic Distribution),你需要先求出它的 CDF,再利用羅吉斯分配對稱於 0 的特性(或直接積分)算出機率 μ。最後,把 μ 表達成 β0+β1X 的函數後,求反函數,即可得到題求的連結函數 h(μ)。

🤖
AI 詳解
AI 專屬家教

【考點分析】 本題測驗潛在變數模型(Latent Variable Model)推導羅吉斯迴歸模型的過程,重點在於羅吉斯分配(Logistic Distribution)機率密度函數的積分(求CDF)以及連結函數(Link Function)的代數轉換。 【理論/法規依據】

小題 (三)

如果其他假設不變,但 Cov(\varepsilon_i, \varepsilon_{i+1}) = \rho$\sigma^2, i=1,$…,n-1。說明由(一)導出之 $\hat{\beta}$是否仍具有不偏性?試舉例說明何種類型的數據會較容易發現 \rho $\neq 0$的情形。如何檢定 \rho = 0(以式子說明概念或作法,無需列出詳細結果)?

思路引導 VIP

面對誤差項存在一階自我相關(AR(1))的問題,首先應回歸普通最小平方法(OLS)估計式不偏性的數學定義,利用期望值的線性運算性質進行推導。接著,聯想實務上具備時間或空間延續性的資料型態。最後,針對自我相關的檢定,直覺應想到利用殘差建構的 Durbin-Watson (DW) 檢定,寫出其核心概念公式即可。

🤖
AI 詳解
AI 專屬家教

【破題】本題探討當古典線性迴歸模型違反「誤差項獨立」假設,產生一階自我相關時,對最小平方法(OLS)估計式的影響,並考驗考生對實務資料特性與迴歸診斷(自我相關檢定)的掌握度。 【論述】 一、$\hat{\beta}$ 是否仍具有不偏性?

小題 (四)

假設自變數 X_i 無法直接被觀察到,而是觀察到一個替代變數 W_i, i=1,...,n, W_i = X_i + $\delta_i$,$\delta_i$為白噪音(white noise)與其他變數均獨立,且 $\delta_i$(i=1,…,n)具有獨立且相同的常態分布 N(0,1)。此時若將 W_i 取代最小平方估計式 $\hat{\beta}$中的 X_i,並令所得之新估計式為 $\hat{\beta}_w$。說明此 $\hat{\beta}_w$是否仍具有不偏性?當 n 很大時,$\hat{\beta}_w$的漸近偏差為何?在此情形下是否可提供較佳的估計式(以式子說明概念或作法,無需列出詳細結果)?

思路引導 VIP

本題測驗「自變數存在測量誤差(Errors-in-Variables)」的經典計量經濟學問題。看到此題應直覺想到:當自變數有測量誤差時,會產生「內生性」問題,導致 OLS 估計量產生「向零偏誤(Attenuation Bias)」。補救措施通常依賴已知誤差變異數進行修正,或尋找合適的工具變數(IV)。

🤖
AI 詳解
AI 專屬家教

【解題思路】本題核心為「自變數測量誤差模型」。因替代變數 W_i 包含隨機誤差 $\delta_i$,將其代入迴歸模型會導致新的誤差項與 W_i 產生相關(內生性問題),進而破壞最小平方估計式(OLS)的不偏性與一致性。可透過動差法修正或工具變數法來尋找較佳估計式。 【詳解】 已知:

📝 同份考卷的其他題目

查看 108年[統計] 迴歸分析 全題

升級 VIP 解鎖