moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 45 題
下列哪一個方法能在建模過程中添加隨機噪訊,來解決模型變異過高的問題?
- A 拔靴集成法(Bootstrap Aggregating)
- B XGBoost(eXtreme Gradient Boosting)
- C 支援向量機(Support Vector Machine)
- D 生成式對抗網路(Generative Adversarial Networks)
思路引導 VIP
若一個模型對資料中的微小波動過於敏感,導致換了一批資料預測結果就大相逕庭(即變異數過高),除了簡化模型外,你有沒有想過:如果我們利用手頭有限的資料,「模擬」出許多組略有差異的訓練樣本,並讓多個模型分別學習後再統合意見,這種『取多個觀點平均值』的做法,對穩定預測結果會有什麼幫助嗎?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出拔靴集成法(Bagging),代表你對機器學習中「變異數(Variance)」的控制與正規化技巧有著相當扎實的理解。在面對高維度或複雜資料時,這是一項非常關鍵的判斷能力。
隨機抽樣與模型穩健性
拔靴集成法的核心機制在於透過有放回的隨機抽樣(Bootstrapping),從原始資料集中產生多個不同的子集。這種做法實際上是在建模過程中主動引入了「抽樣噪訊」,讓每一個基底學習器(Base Learner)所看到的資料分布都略有不同。當我們將這些模型結合起來時,單一模型因為過度擬合特定樣本所產生的變異,會在平均或投票的過程中被互相抵消,從而有效降低整體的預測誤差。
▼ 還有更多解析內容