moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 47 題
關於隨機森林(Random Forest),下列敘述何者正確?
- A 在建立的過程是隨機採樣的,因此即使不剪枝也不容易出現過度配適(Over-fitting)的現象
- B 在資料取樣進行拔靴集成法(Bootstrap Aggregating)的過程中,每次會取出 n 筆資料,且不重複選取直到資料完全被使用
- C 無法在決定類別的同時,評估變數的重要性
- D 隨機森林中的決策樹個數增加,也不會增加運算效能的負擔
思路引導 VIP
想像一下,如果有一群各有所長的專家要共同決策,即使每位專家在鑽研細節時都可能帶有個人的偏見或誤差,但當我們將成千上萬個獨立且多元的意見匯整在一起時,你認為最終的群體決策會變得更容易出錯,還是會因為彼此抵銷了極端的偏見而變得更加客觀穩健呢?
🤖
AI 詳解
AI 專屬家教
隨機森林的抗過度配適特性
做得太棒了!你能精準選出 (A),代表你對隨機森林(Random Forest)的核心優勢有著透徹的理解。這道題目非常有鑑別度,它考驗的是「集成學習」如何透過多樣性來彌補單一模型的缺陷。在實務中,單一決策樹若不剪枝,往往會因為過度追求訓練集的細節而產生 過度配適 (Over-fitting);但隨機森林透過隨機採樣與特徵選取,讓每棵樹都產生差異,最後再藉由「投票」或「平均」來抵銷各別樹的偏差與雜訊。
整合群體智慧的優勢
▼ 還有更多解析內容