免費開始練習
高考申論題 106年 [統計] 迴歸分析

第 一 題

📖 題組:
在作迴歸分析時,經常會遇到離群值和有影響力觀察值(influential data point)的問題。請試述何謂離群值和有影響力觀察值。並請分別試述兩種判斷準則偵測迴歸分析中的離群值和有影響力觀察值。(12 分) (二)圖 2A 是一組數據的散佈圖,圖 2B 提供兩條估計線,實線估計式Y^ = 2.8 + 4.97X 包括第 51 點觀察值((X51, Y51) = (4,50)),虛線估計式Y^ = 3.68 + 4.98X 不包括第 51 點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據是否包含任何有影響力觀察值?另請說明理由。(4 分) (三)圖 3A 是另一組數據的散佈圖,圖 3B 提供兩條估計線,實線估計式 Y^ = 6.95 + 4.08X,包括第 41 點觀察值 ((X41, Y41) = (10,16)),虛線估計式 Y^ = 1.93 + 5.21X 不包括第 41 點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據集是否包含任何有影響力觀察值?另請說明理由。(4 分)
📝 此題為申論題,共 7 小題

小題 (一)

請試述何謂離群值和有影響力觀察值。並請分別試述兩種判斷準則偵測迴歸分析中的離群值和有影響力觀察值。(12 分)

思路引導 VIP

看到此題應先釐清「離群值」與「有影響力觀察值」在迴歸模型中的本質差異:前者是 Y 方向上的異常(殘差大),後者是對模型估計結果造成重大改變的點(通常結合 X 方向的槓桿值與 Y 方向的殘差)。作答時,先精確定義兩者,接著各列舉兩種常見的統計診斷指標(如學生化殘差、Cook's D 等),並給出具體的經驗判斷準則。

🤖
AI 詳解
AI 專屬家教

【破題】本題核心在於區辨迴歸模型中「離群值」與「有影響力觀察值」之定義差異,並熟悉相應的統計診斷工具。 【論述】 一、名詞定義

小題 (二)

圖 2A 是一組數據的散佈圖,圖 2B 提供兩條估計線,實線估計式Y^ = 2.8 + 4.97X 包括第 51 點觀察值((X51, Y51) = (4,50)),虛線估計式Y^ = 3.68 + 4.98X 不包括第 51 點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據是否包含任何有影響力觀察值?另請說明理由。(4 分)

思路引導 VIP

作答此題須緊扣「離群值」與「影響力觀察值」的定義。可透過計算該點代入原迴歸線所產生的殘差大小來判斷是否為離群值;並藉由比較剔除該點前後,迴歸係數(尤其斜率)是否發生劇烈變化,來判斷該點是否具備影響力。

🤖
AI 詳解
AI 專屬家教

【破題】 本組數據集包含離群值,但不包含有影響力觀察值。 【論述】

小題 (三)

圖 3A 是另一組數據的散佈圖,圖 3B 提供兩條估計線,實線估計式 Y^ = 6.95 + 4.08X,包括第 41 點觀察值 ((X41, Y41) = (10,16)),虛線估計式 Y^ = 1.93 + 5.21X 不包括第 41 點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據集是否包含任何有影響力觀察值?另請說明理由。(4 分)

思路引導 VIP

面對這類給定兩種迴歸式的對比題,應先回歸定義。判斷離群值,可將該點的 X 代入『不含該點』的迴歸式求出預測 Y,若與實際 Y 差距極大(大殘差)即為離群值;判斷有影響力觀察值,則直接比較『包含』與『不包含』該點的兩條迴歸式,若截距或斜率發生顯著變動,即證明該點對模型具有影響力。

🤖
AI 詳解
AI 專屬家教

【破題】這組數據集包含離群值,同時也包含有影響力觀察值。第 41 點 $(X_{41}, Y_{41}) = (10, 16)$ 同時符合這兩者的特徵。 【論述】 一、離群值(Outlier)的判斷與理由

小題 (四)

針對迴歸模型 LM3 於試卷上依序填入下列ANOVA 表中(1)~(8)之8個空格內容。(8分) Analysis of Variance Source DF Sum of Squares Mean Square F Value Model (1) (3) (6) (8) Error (2) (4) (7) Corrected Total 10 (5)

思路引導 VIP

考生看到此題應先從 ANOVA 表的結構與題目給定的基本統計量出發。首先利用 Corrected Total 的自由度 (DF=10) 確認樣本數 (n=11),並透過 Y 的標準差 (s=2) 反推總變異平方和 (SST)。接著利用平方和的加法性 (SST = SSR + SSE) 與已知模型的 SSE,即可依序推導出所有空格的數值。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】利用變異數分析(ANOVA)表各欄位的基本定義與加法性質(SST = SSR + SSE),以及從 Y 的標準差反推總平方和(SST)。 【解答】 計算:

小題 (五)

針對迴歸模型 LM3 欲檢定 X2 的係數是否為0,求出偏F檢定的計算值。(6分)

思路引導 VIP

看到偏F檢定,首要聯想「額外平方和原則」(Extra Sum of Squares)。辨認出完整模型(LM3)與縮減模型(LM1),並找出對應的誤差平方和 (SSE) 與自由度(需辨識題幹中的樣本數 n=11),代入偏 F 統計量公式即可求解。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】偏 F 檢定的核心為比較「縮減模型」與「完整模型」的誤差平方和 (SSE) 差異,公式為 F = [(SSE_reduced - SSE_full) / (df_reduced - df_full)] / [SSE_full / df_full]。 【解答】 計算:

小題 (六)

針對迴歸模型 LM3,當迴歸係數在什麼條件下,MSR的期望值為²?(5分)

思路引導 VIP

本題測驗變異數分析(ANOVA)表的核心概念。考生應聯想到迴歸均方(MSR)的期望值公式包含了誤差變異數與真實迴歸係數構成的二次式,進而推導出只有當所有斜率係數皆為零(即總檢定之虛無假說成立)時,E(MSR) 才會等於誤差變異數。

🤖
AI 詳解
AI 專屬家教

【解題思路】利用變異數分析(ANOVA)中迴歸均方(MSR)的期望值理論,分析在何種母體參數條件下,MSR 的期望值會恰好等於誤差變異數 σ²。 【詳解】 已知:迴歸模型 LM3 包含兩個解釋變數 X₁ 與 X₂,其真實的母體模型可表示為:

小題 (七)

若三個變數之變異數-共變異數矩陣為: 110 V=141 0116 為了求其相關係數矩陣,需在V前後乘一個對角矩陣,寫出此對角矩陣。(5分)

思路引導 VIP

看到由變異數-共變異數矩陣求相關係數矩陣,應立即聯想到矩陣轉換公式 R = D^{-1/2} V D^{-1/2}。關鍵在於提取 V 主對角線上的變異數,將其開根號求得標準差,再取倒數即可構造出所需乘上的對角矩陣。

🤖
AI 詳解
AI 專屬家教

【解題思路】利用變異數-共變異數矩陣轉換為相關係數矩陣的公式:$R = D^{-1/2} V D^{-1/2}$,其中 $D^{-1/2}$ 為標準差倒數所構成的對角矩陣。 【詳解】 已知:變異數-共變異數矩陣 $V$ 的對角線元素即為各變數的變異數,分別為:

📝 同份考卷的其他題目

查看 106年[統計] 迴歸分析 全題

升級 VIP 解鎖