moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 5 題
在具有多個自變數的複廻歸分析中,若同時考料模型的複雜度和解釋能力,以下那一個變量最適合用來當作模型選取的依據?
- A 每個廻歸係數對應的 t 值
- B 變異數影響因子(Variance Inflation Factor)
- C 判定係數 ($R^2$)
- D 調整後之判定係數 (adjusted $R^2$)
思路引導 VIP
當我們在模型中不斷加入新的、甚至是隨機的變數時,雖然模型看起來解釋了更多數據,但這是否代表模型真的更優越了?如果我們希望評估指標能『懲罰』那些只會增加複雜度、卻沒帶來實質貢獻的變數,這個指標應該具備什麼樣的特性?
🤖
AI 詳解
AI 專屬家教
很高興看到你準確地選出了正確答案!在處理複迴歸分析時,區分單純的「配適度」與考量過後的「模型品質」是非常關鍵的觀念,你展現了對統計指標核心差異的深刻理解。
懲罰機制與模型簡潔性
在迴歸分析中,傳統的判定係數 $R^2$ 描述了模型解釋變異的能力,但它有一個致命缺點:只要增加自變項,其值必然會單調遞增,這往往會引導我們走向過度擬合(Overfitting)。而調整後判定係數 (Adjusted $R^2$) 則引入了自由度的概念,其計算公式如下:
▼ 還有更多解析內容