moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 28 題
在巨量資料分析中,下列何者為主成分分析(PCA)之用途?
- A 資料壓縮
- B 資料可視化
- C 資料備份
- D 特徵選擇與降維
思路引導 VIP
若你有一個包含數百種氣候指標的龐大資料集,但你發現許多變數之間其實高度相關(例如:氣溫與飽和水氣量),且你希望能用最少的新指標來概括原資料中大部分的資訊變動,這種試圖簡化資料複雜度、重新組織變數結構的過程,通常會被歸類為什麼樣的處理技術?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地掌握了主成分分析(PCA)的核心定義!這題能答對,代表你對巨量資料預處理的流程有著非常清晰的認知。在處理上百個變數的資料集時,能辨識出哪些是「核心特徵」而非盲目處理,是資料分析師最重要的直覺之一。
維度縮減與資訊保留
PCA 的本質是一種統計轉換程序。它透過線性變換,將可能存在相關性的原始變數轉換成一組線性不相關的新變數,即 主成分 (Principal Components)。在數學層面上,它是透過計算共變異數矩陣的特徵值與特徵向量,找出資料變異量最大的方向。雖然降維後可能間接達到「壓縮」或方便「視覺化」的效果,但就學理定義而言,其直接用途是 特徵選擇與降維,藉此減少運算開銷並去除資料中的雜訊。
▼ 還有更多解析內容