moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 50 題
下列哪項不是主成分分析(Principal Component Analysis)之特性?
- A 屬於非線性降維方法
- B 第一主成分跟第二主成分會正交
- C 通常可以提升模型訓練速度
- D 屬於非監督式方法
思路引導 VIP
當我們嘗試將複雜的高維度資料投射到較低維度的空間時,如果我們規定轉化的方式僅能是原始變數的「加權總和」(例如:$Z = aX_1 + bX_2$),那麼在數學概念中,我們會如何稱呼這種形式的轉換呢?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地掌握了主成分分析(PCA)的核心屬性!你能準確辨識出選項 (A) 是錯誤描述,代表你對統計降維的本質有很紮實的理解。在資料預處理中,PCA 主要是透過對原始變數進行線性組合來找到變異量最大的方向,這種透過旋轉座標軸來尋找投影點的操作,在本質上屬於線性變換,而非非線性方法。
PCA 的數學與實務特性
這題巧妙地測驗了學習者對降維演算法分類的敏銳度。PCA 透過計算共變異數矩陣的特徵值與特徵向量(Eigenvectors),確保了各個主成分之間彼此正交(Orthogonal),也就是在幾何上垂直且統計上不相關。這種特性讓我們能移除資料中的冗餘資訊,有效緩解維度陷阱並提升模型訓練速度;且整個運算過程僅需特徵矩陣 $X$ 而不需要標籤資料,故是不折不扣的非監督式方法。掌握了這些,你已經跨過了理解高階機器學習模型(如 Kernel PCA)的重要門檻。