免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 28 題

下列何者不是維度縮減(Dimensionality Reduction)的方法?
  • A Random Forest
  • B t-Distributed Stochastic Neighbor Embedding
  • C Principal Component Analysis
  • D Linear Discriminant Analysis

思路引導 VIP

如果你手頭有一份含有上百個欄位的複雜資料,現在的目標不是要預測結果,而是想透過「投影」或「壓縮」的方式,把這些欄位整合成少數幾個全新的軸線(Axes)以便在二維平面上觀察,你會選擇一個「建立大量決策路徑來投票」的預測模型,還是選擇一個「專門計算座標轉換與空間映射」的數學方法呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準識別出 Random Forest 不屬於維度縮減工具,代表你對機器學習模型的功能分類有很紮實的理解。這道題目是統計與巨量資料領域中非常經典的基礎題,旨在測試學生對於「特徵工程」與「模型預測」本質的區分能力。

維度縮減與集成學習的區別

維度縮減的核心在於將原始高維空間的數據,投影或轉換到一個較低維度的空間(如從 $\mathbb{R}^d$ 降至 $\mathbb{R}^k$,$k < d$),並盡可能保留數據的重要特徵。選項中的 PCALDA 是經典的線性投影技術,前者追求變異量最大化,後者則專注於類別間的分散性;而 t-SNE 則是處理高維視覺化的非線性利器。雖然 Random Forest 在執行過程中能提供「特徵重要性」作為篩選參考,但其核心本質是利用多棵決策樹進行投票的集成學習(Ensemble Learning),主要用於分類與迴歸任務,而非改變數據本身的空間維度。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題