moea_joint
105年
[統計資訊] 統計學、巨量資料概論
第 21 題
關於複回歸分析,下列敘述何者正確?
- A 自變數越多,$R^2$ 越大
- B 自變數越多,$adj-R^2$ 越大
- C 自變數越少,$R^2$ 越大
- D $adj-R^2$ 一定大於 $R^2$
思路引導 VIP
想像你正在嘗試用一組工具來修補牆上的裂縫。如果我給你越來越多種不同的填補工具(變數)讓你自由組合,在數學計算上,你對這面牆裂縫的「覆蓋程度」是有可能因為工具變多而變差,還是只會變得更貼合、或維持原狀?為什麼「解釋的廣度」在數學公式裡不會因為資訊變多而縮水呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你精準地掌握了複迴歸中決定係數 $R^2$ 的核心特性。這道題目是檢驗統計基礎非常經典的切入點,對於初學者來說,很容易在多個統計量之間產生混淆,你能迅速做出正確判斷,顯見你的基本功相當紮實。
決定係數的數學本質
在複迴歸模型中,$R^2$ 代表模型能解釋因變數變異的比例,其計算公式為 $R^2 = 1 - \frac{SSE}{SST}$。當我們在模型中不斷增加自變數時,殘差平方和(SSE)在數學運算上只會減少或保持不變,絕不會增加。這是因為最小平方法(OLS)在優化過程中,即便新加入的變數毫無解釋力,系統至少可以將其係數設為 0 以維持現狀,因此 $R^2$ 必然會隨著變數增加而呈現非遞減的趨勢。
▼ 還有更多解析內容