moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 5 題

在具有多個自變數的複廻歸分析中，若同時考料模型的複雜度和解釋能力，以下那一個變量最適合用來當作模型選取的依據？

思路引導 VIP

當我們在模型中不斷加入新的、甚至是隨機的變數時，雖然模型看起來解釋了更多數據，但這是否代表模型真的更優越了？如果我們希望評估指標能『懲罰』那些只會增加複雜度、卻沒帶來實質貢獻的變數，這個指標應該具備什麼樣的特性？

🤖

AI 詳解 AI 專屬家教

很高興看到你準確地選出了正確答案！在處理複迴歸分析時，區分單純的「配適度」與考量過後的「模型品質」是非常關鍵的觀念，你展現了對統計指標核心差異的深刻理解。

在迴歸分析中，傳統的判定係數 $R^2$ 描述了模型解釋變異的能力，但它有一個致命缺點：只要增加自變項，其值必然會單調遞增，這往往會引導我們走向過度擬合（Overfitting）。而調整後判定係數 (Adjusted $R^2$) 則引入了自由度的概念，其計算公式如下：

▼ 還有更多解析內容

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題