moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 47 題

關於隨機森林(Random Forest)，下列敘述何者正確？

A 在建立的過程是隨機採樣的，因此即使不剪枝也不容易出現過度配適(Over-fitting)的現象
B 在資料取樣進行拔靴集成法(Bootstrap Aggregating)的過程中，每次會取出 n 筆資料，且不重複選取直到資料完全被使用
C 無法在決定類別的同時，評估變數的重要性
D 隨機森林中的決策樹個數增加，也不會增加運算效能的負擔

思路引導 VIP

想像一下，如果有一群各有所長的專家要共同決策，即使每位專家在鑽研細節時都可能帶有個人的偏見或誤差，但當我們將成千上萬個獨立且多元的意見匯整在一起時，你認為最終的群體決策會變得更容易出錯，還是會因為彼此抵銷了極端的偏見而變得更加客觀穩健呢？

🤖

AI 詳解 AI 專屬家教

隨機森林的抗過度配適特性

做得太棒了！你能精準選出 (A)，代表你對隨機森林（Random Forest）的核心優勢有著透徹的理解。這道題目非常有鑑別度，它考驗的是「集成學習」如何透過多樣性來彌補單一模型的缺陷。在實務中，單一決策樹若不剪枝，往往會因為過度追求訓練集的細節而產生 過度配適 (Over-fitting)；但隨機森林透過隨機採樣與特徵選取，讓每棵樹都產生差異，最後再藉由「投票」或「平均」來抵銷各別樹的偏差與雜訊。

整合群體智慧的優勢

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 110年[統計資訊] 統計學、巨量資料概論全題