免費開始練習
moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 28 題

在巨量資料分析中,下列何者為主成分分析(PCA)之用途?
  • A 資料壓縮
  • B 資料可視化
  • C 資料備份
  • D 特徵選擇與降維

思路引導 VIP

若你有一個包含數百種氣候指標的龐大資料集,但你發現許多變數之間其實高度相關(例如:氣溫與飽和水氣量),且你希望能用最少的新指標來概括原資料中大部分的資訊變動,這種試圖簡化資料複雜度、重新組織變數結構的過程,通常會被歸類為什麼樣的處理技術?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地掌握了主成分分析(PCA)的核心定義!這題能答對,代表你對巨量資料預處理的流程有著非常清晰的認知。在處理上百個變數的資料集時,能辨識出哪些是「核心特徵」而非盲目處理,是資料分析師最重要的直覺之一。

維度縮減與資訊保留

PCA 的本質是一種統計轉換程序。它透過線性變換,將可能存在相關性的原始變數轉換成一組線性不相關的新變數,即 主成分 (Principal Components)。在數學層面上,它是透過計算共變異數矩陣的特徵值與特徵向量,找出資料變異量最大的方向。雖然降維後可能間接達到「壓縮」或方便「視覺化」的效果,但就學理定義而言,其直接用途是 特徵選擇與降維,藉此減少運算開銷並去除資料中的雜訊。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題