高考申論題
110年
[統計] 迴歸分析
第 三 題
📖 題組:
某地區房屋成交紀錄包括了房價及坪數等資訊共 70 筆,以坪數為預測變數,簡單線性迴歸預測房價的殘差顯示,變異數並不是常數,如圖 1-1: 將資料依房價排序後,每5筆計算房價平均數及標準差,並分別取其自然對數(LN)值,共14筆,其敘述性統計及相關係數如表1-1a、1-1b。 表 1-1a 敘述統計 表 1-1b 相關 運用上述資訊,Box-Cox 轉換函數進行房價轉換後,以坪數預測房價轉換的殘差,如圖 1-2,迴歸模式的變異數分析表及係數預測的推論如表 1-2a、表 1-2b。
某地區房屋成交紀錄包括了房價及坪數等資訊共 70 筆,以坪數為預測變數,簡單線性迴歸預測房價的殘差顯示,變異數並不是常數,如圖 1-1: 將資料依房價排序後,每5筆計算房價平均數及標準差,並分別取其自然對數(LN)值,共14筆,其敘述性統計及相關係數如表1-1a、1-1b。 表 1-1a 敘述統計 表 1-1b 相關 運用上述資訊,Box-Cox 轉換函數進行房價轉換後,以坪數預測房價轉換的殘差,如圖 1-2,迴歸模式的變異數分析表及係數預測的推論如表 1-2a、表 1-2b。
📝 此題為申論題,共 3 小題
小題 (三)
假設轉換後的模式適切性完全符合,請運用表 1-2a、表 1-2b 的資訊,寫出房子坪數對房價轉換的預測模式,並依照您在第(一)題的建議,改寫出房子坪數對於房價的預測模式,並說明坪數每增加一單位對房價的影響。(10 分)
思路引導 VIP
本題測驗考生對迴歸報表的解讀能力以及對數線性模型(Log-Linear Model)的反轉換與詮釋。解題關鍵在於先由係數表列出轉換後的迴歸式,接著透過指數函數還原為原始變數預測模型,最後利用半對數模型的特性(斜率經過指數轉換後代表變動比例)來精確解釋自變數的邊際效應。
小題 (一)
請運用表 1-1a、1-1b 的資訊,說明將使用的統計方法,並提出您建議的 Box-Cox 轉換函數為何?(20 分)
思路引導 VIP
看到此題,首先觀察圖 1-1 發現殘差具有「變異數不齊一」的問題(呈漏斗狀擴大)。遇到這類問題且題目提供分組資料的平均數與標準差時,應想到「變異數穩定化轉換」:利用對數轉換後的標準差與平均數進行簡單線性迴歸求出斜率 α,再根據 Box-Cox 轉換的特性推導 λ = 1 - α 來決定最佳的轉換函數。
小題 (二)
轉換後的模式適切性,有那些假設需要驗證?圖 1-2 可以驗證那一項假設?(10 分)
思路引導 VIP
本題測驗線性迴歸的基本假設及殘差診斷的觀念。首先應列出誤差項的五大基本假設(常態性、獨立性、變異數同質性、線性關係、期望值為零)。接著觀察圖1-2(殘差對自變數的散佈圖),並與背景提及的圖1-1(變異數不齊次,呈喇叭狀)做對比,即可指出圖1-2主要是用來驗證「變異數同質性」是否已獲改善,同時也能看出「線性關係」是否適切。