免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 50 題

下列哪項不是主成分分析(Principal Component Analysis)之特性?
  • A 屬於非線性降維方法
  • B 第一主成分跟第二主成分會正交
  • C 通常可以提升模型訓練速度
  • D 屬於非監督式方法

思路引導 VIP

當我們嘗試將複雜的高維度資料投射到較低維度的空間時,如果我們規定轉化的方式僅能是原始變數的「加權總和」(例如:$Z = aX_1 + bX_2$),那麼在數學概念中,我們會如何稱呼這種形式的轉換呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地掌握了主成分分析(PCA)的核心屬性!你能準確辨識出選項 (A) 是錯誤描述,代表你對統計降維的本質有很紮實的理解。在資料預處理中,PCA 主要是透過對原始變數進行線性組合來找到變異量最大的方向,這種透過旋轉座標軸來尋找投影點的操作,在本質上屬於線性變換,而非非線性方法。

PCA 的數學與實務特性

這題巧妙地測驗了學習者對降維演算法分類的敏銳度。PCA 透過計算共變異數矩陣的特徵值與特徵向量(Eigenvectors),確保了各個主成分之間彼此正交(Orthogonal),也就是在幾何上垂直且統計上不相關。這種特性讓我們能移除資料中的冗餘資訊,有效緩解維度陷阱並提升模型訓練速度;且整個運算過程僅需特徵矩陣 $X$ 而不需要標籤資料,故是不折不扣的非監督式方法。掌握了這些,你已經跨過了理解高階機器學習模型(如 Kernel PCA)的重要門檻。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題