第 六 題
一國內規模最大的律師事務所專門辦理職災案件,總經理想了解他們在捷運上的廣告有沒有增加他們的業務量,根據過去隨機抽取 11 月的資料,利用兩個解釋變數:一為單月廣告費用X₁(單位為百萬元,平均值為1單位,標準差為2單位),另一個為主要競爭對手單月廣告費用 X2 (單位為百萬元,平均值為1單位,標準差為2單位)來預測職災案件的每月增加件數Y(單位為件,平均值為3件,標準差為2件),下表是以不同解釋變數配適每月增加件數Y之迴歸模型的參數最小平方估計量和誤差平方和 SSE。 迴歸模型代號 迴歸模型中的解釋變數 參數最小平方估計量SSE LM1 X1 b₁ = 0.3 5 LM2 X2 b2=-0.1 8 LM3 X1, X2 b₁ = 0.2, b2=-0.2 4 下面所有小題的計算若除不盡,一律四捨五入到小數第二位,否則不給分。
小題 (六)
思路引導 VIP
本題測驗變異數分析(ANOVA)表的核心概念。考生應聯想到迴歸均方(MSR)的期望值公式包含了誤差變異數與真實迴歸係數構成的二次式,進而推導出只有當所有斜率係數皆為零(即總檢定之虛無假說成立)時,E(MSR) 才會等於誤差變異數。
小題 (一)
思路引導 VIP
看到此題應先釐清「離群值」與「有影響力觀察值」在迴歸模型中的本質差異:前者是 Y 方向上的異常(殘差大),後者是對模型估計結果造成重大改變的點(通常結合 X 方向的槓桿值與 Y 方向的殘差)。作答時,先精確定義兩者,接著各列舉兩種常見的統計診斷指標(如學生化殘差、Cook's D 等),並給出具體的經驗判斷準則。
小題 (二)
思路引導 VIP
作答此題須緊扣「離群值」與「影響力觀察值」的定義。可透過計算該點代入原迴歸線所產生的殘差大小來判斷是否為離群值;並藉由比較剔除該點前後,迴歸係數(尤其斜率)是否發生劇烈變化,來判斷該點是否具備影響力。
小題 (三)
思路引導 VIP
面對這類給定兩種迴歸式的對比題,應先回歸定義。判斷離群值,可將該點的 X 代入『不含該點』的迴歸式求出預測 Y,若與實際 Y 差距極大(大殘差)即為離群值;判斷有影響力觀察值,則直接比較『包含』與『不包含』該點的兩條迴歸式,若截距或斜率發生顯著變動,即證明該點對模型具有影響力。
小題 (四)
Analysis of Variance
Source
DF
Sum of Squares
Mean Square
F Value
Model
(1)
(3)
(6)
(8)
Error
(2)
(4)
(7)
Corrected Total
10
(5)
思路引導 VIP
考生看到此題應先從 ANOVA 表的結構與題目給定的基本統計量出發。首先利用 Corrected Total 的自由度 (DF=10) 確認樣本數 (n=11),並透過 Y 的標準差 (s=2) 反推總變異平方和 (SST)。接著利用平方和的加法性 (SST = SSR + SSE) 與已知模型的 SSE,即可依序推導出所有空格的數值。
小題 (五)
思路引導 VIP
看到偏F檢定,首要聯想「額外平方和原則」(Extra Sum of Squares)。辨認出完整模型(LM3)與縮減模型(LM1),並找出對應的誤差平方和 (SSE) 與自由度(需辨識題幹中的樣本數 n=11),代入偏 F 統計量公式即可求解。
小題 (七)
110
V=141
0116
為了求其相關係數矩陣,需在V前後乘一個對角矩陣,寫出此對角矩陣。(5分)
思路引導 VIP
看到由變異數-共變異數矩陣求相關係數矩陣,應立即聯想到矩陣轉換公式 R = D^{-1/2} V D^{-1/2}。關鍵在於提取 V 主對角線上的變異數,將其開根號求得標準差,再取倒數即可構造出所需乘上的對角矩陣。