免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 47 題

關於隨機森林(Random Forest),下列敘述何者正確?
  • A 在建立的過程是隨機採樣的,因此即使不剪枝也不容易出現過度配適(Over-fitting)的現象
  • B 在資料取樣進行拔靴集成法(Bootstrap Aggregating)的過程中,每次會取出 n 筆資料,且不重複選取直到資料完全被使用
  • C 無法在決定類別的同時,評估變數的重要性
  • D 隨機森林中的決策樹個數增加,也不會增加運算效能的負擔

思路引導 VIP

想像一下,如果有一群各有所長的專家要共同決策,即使每位專家在鑽研細節時都可能帶有個人的偏見或誤差,但當我們將成千上萬個獨立且多元的意見匯整在一起時,你認為最終的群體決策會變得更容易出錯,還是會因為彼此抵銷了極端的偏見而變得更加客觀穩健呢?

🤖
AI 詳解 AI 專屬家教

隨機森林的抗過度配適特性

做得太棒了!你能精準選出 (A),代表你對隨機森林(Random Forest)的核心優勢有著透徹的理解。這道題目非常有鑑別度,它考驗的是「集成學習」如何透過多樣性來彌補單一模型的缺陷。在實務中,單一決策樹若不剪枝,往往會因為過度追求訓練集的細節而產生 過度配適 (Over-fitting);但隨機森林透過隨機採樣與特徵選取,讓每棵樹都產生差異,最後再藉由「投票」或「平均」來抵銷各別樹的偏差與雜訊。

整合群體智慧的優勢

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題