免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 45 題

下列哪一個方法能在建模過程中添加隨機噪訊,來解決模型變異過高的問題?
  • A 拔靴集成法(Bootstrap Aggregating)
  • B XGBoost(eXtreme Gradient Boosting)
  • C 支援向量機(Support Vector Machine)
  • D 生成式對抗網路(Generative Adversarial Networks)

思路引導 VIP

若一個模型對資料中的微小波動過於敏感,導致換了一批資料預測結果就大相逕庭(即變異數過高),除了簡化模型外,你有沒有想過:如果我們利用手頭有限的資料,「模擬」出許多組略有差異的訓練樣本,並讓多個模型分別學習後再統合意見,這種『取多個觀點平均值』的做法,對穩定預測結果會有什麼幫助嗎?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出拔靴集成法(Bagging),代表你對機器學習中「變異數(Variance)」的控制與正規化技巧有著相當扎實的理解。在面對高維度或複雜資料時,這是一項非常關鍵的判斷能力。

隨機抽樣與模型穩健性

拔靴集成法的核心機制在於透過有放回的隨機抽樣(Bootstrapping),從原始資料集中產生多個不同的子集。這種做法實際上是在建模過程中主動引入了「抽樣噪訊」,讓每一個基底學習器(Base Learner)所看到的資料分布都略有不同。當我們將這些模型結合起來時,單一模型因為過度擬合特定樣本所產生的變異,會在平均或投票的過程中被互相抵消,從而有效降低整體的預測誤差。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題