高考申論題
111年
[統計] 迴歸分析
第 一 題
📖 題組:
下表為隨機抽取全臺 30 處茶園所生產的某一品種之茶葉資料,包括該茶園所在的區域(標示為 1、2、3)、茶葉每 10 公克價格(單位:新臺幣元)及由茶葉的特性綜合計算而得之兩種因素(甲、乙)分數。 (茶園資料表略,包含茶園1-30之因素甲、因素乙、區域、價格Y,以及總和與總平方和資料) 總和:因素甲=144.00, 因素乙=123.90, 區域=60, 價格(Y)=375.60 總平方和:因素甲=722.02, 因素乙=523.03, 區域=142, 價格(Y)=4821.30 「總和」與「總平方和」表示該變數之值的加總及取平方後之加總。 定義區域 X3 之指標變數如下: D1 = {1 若該茶園屬於區域 1; 0 其他}、D2 = {1 若該茶園屬於區域 2; 0 其他}、D3 = {1 若該茶園屬於區域 3; 0 其他} 以茶葉每 10 公克之價格為反應變數,考慮迴歸模型如下: Y = β0 + β1X3 + ε (模型 A) Y = β0 + β1D2 + β2D3 + ε (模型 B) Y = β0 + β1D1 + β2D2 + ε (模型 C) Y = β0 + β1D1 + β2D2 + β3D3 + ε (模型 D) Y = β1D1 + β2D2 + β3D3 + ε (模型 E) ε 為隨機誤差項。
下表為隨機抽取全臺 30 處茶園所生產的某一品種之茶葉資料,包括該茶園所在的區域(標示為 1、2、3)、茶葉每 10 公克價格(單位:新臺幣元)及由茶葉的特性綜合計算而得之兩種因素(甲、乙)分數。 (茶園資料表略,包含茶園1-30之因素甲、因素乙、區域、價格Y,以及總和與總平方和資料) 總和:因素甲=144.00, 因素乙=123.90, 區域=60, 價格(Y)=375.60 總平方和:因素甲=722.02, 因素乙=523.03, 區域=142, 價格(Y)=4821.30 「總和」與「總平方和」表示該變數之值的加總及取平方後之加總。 定義區域 X3 之指標變數如下: D1 = {1 若該茶園屬於區域 1; 0 其他}、D2 = {1 若該茶園屬於區域 2; 0 其他}、D3 = {1 若該茶園屬於區域 3; 0 其他} 以茶葉每 10 公克之價格為反應變數,考慮迴歸模型如下: Y = β0 + β1X3 + ε (模型 A) Y = β0 + β1D2 + β2D3 + ε (模型 B) Y = β0 + β1D1 + β2D2 + ε (模型 C) Y = β0 + β1D1 + β2D2 + β3D3 + ε (模型 D) Y = β1D1 + β2D2 + β3D3 + ε (模型 E) ε 為隨機誤差項。
📝 此題為申論題,共 3 小題
小題 (一)
說明模型 A、B、C、D 及 E 所表達的意義,並決定那些模型是較合適的。(10 分)
思路引導 VIP
本題測驗對於「類別變數(Categorical Variable)」及「虛擬變數(Dummy Variable)」在迴歸模型中設定的理解。思考時應先辨識出「區域」是一個名目尺度(Nominal)的類別變數,直接將其作為連續數值放入模型(如模型A)會產生強加的線性關係假設,並不合理。接著,要理解虛擬變數陷阱(Dummy Variable Trap):若模型包含截距項,則虛擬變數的個數應為類別數減一(如模型B、C);若不含截距項,則可放入與類別數相等的虛擬變數(如模型E)。模型D同時放入截距項和所有虛擬變數,會導致完全共線性,無法估計。
小題 (二)
依據模型 B,得到以下估計結果:
(估計表包含 Intercept: 11.7455, D2: -0.9580, D3: 2.8091, R² = 0.6410)
試詳細說明係數 β2 之估計值的意義,並計算此模型之迴歸標準誤的估計。(8 分)
思路引導 VIP
第一部分是解釋係數:模型B以區域1為基準,β2是D3的係數,因此它代表區域3相較於區域1的平均價格差異。第二部分是計算迴歸標準誤(S或RMSE)。公式為 S = √(MSE) = √(SSE/(n-k-1))。題目給了 R² = 0.6410,且 R² = 1 - (SSE/SST)。要先利用題目最上方的「總和」與「總平方和」計算出 Y 的總變異 SST (Total Sum of Squares)。SST = ΣY² - (ΣY)²/n。算出 SST 後,代入求出 SSE,接著計算 MSE,最後開根號即可得到標準誤。
小題 (三)
試寫出模型 C、D 及 E 之所有迴歸係數的估計值。(12 分)
思路引導 VIP
這是一道邏輯推演題。已知模型B的結果,我們可以輕易算出各區域的實際平均價格: 區域1平均 = Intercept = 11.7455