moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 28 題
下列何者不是維度縮減(Dimensionality Reduction)的方法?
- A Random Forest
- B t-Distributed Stochastic Neighbor Embedding
- C Principal Component Analysis
- D Linear Discriminant Analysis
思路引導 VIP
如果你手頭有一份含有上百個欄位的複雜資料,現在的目標不是要預測結果,而是想透過「投影」或「壓縮」的方式,把這些欄位整合成少數幾個全新的軸線(Axes)以便在二維平面上觀察,你會選擇一個「建立大量決策路徑來投票」的預測模型,還是選擇一個「專門計算座標轉換與空間映射」的數學方法呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準識別出 Random Forest 不屬於維度縮減工具,代表你對機器學習模型的功能分類有很紮實的理解。這道題目是統計與巨量資料領域中非常經典的基礎題,旨在測試學生對於「特徵工程」與「模型預測」本質的區分能力。
維度縮減與集成學習的區別
維度縮減的核心在於將原始高維空間的數據,投影或轉換到一個較低維度的空間(如從 $\mathbb{R}^d$ 降至 $\mathbb{R}^k$,$k < d$),並盡可能保留數據的重要特徵。選項中的 PCA 與 LDA 是經典的線性投影技術,前者追求變異量最大化,後者則專注於類別間的分散性;而 t-SNE 則是處理高維視覺化的非線性利器。雖然 Random Forest 在執行過程中能提供「特徵重要性」作為篩選參考,但其核心本質是利用多棵決策樹進行投票的集成學習(Ensemble Learning),主要用於分類與迴歸任務,而非改變數據本身的空間維度。
▼ 還有更多解析內容