moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 48 題
資料視覺化是資料處理中一項重要工作,通常資料視覺化需要使用到下列哪種方法?
- A 資料維度降維
- B 建立分類模型
- C 建立迴歸模型
- D 調整模型參數
思路引導 VIP
「想像一下,如果你手邊有一份包含 100 種特徵(例如身高、體重、年齡...等 100 項指標)的複雜客戶資料,而你現在只有一張平面的白紙可以繪圖。在不失真太多的前提下,你必須對這 100 個指標的『數量』做什麼樣的數學處理,才能讓資料點呈現在這張二維的紙上呢?」
🤖
AI 詳解
AI 專屬家教
恭喜你精準地選出了正確答案!這顯示你對大數據處理中的「視覺呈現限制」與「特徵工程」有著很紮實的觀念連結。
高維度資料的映射與呈現
在現實的資料科學情境中,我們處理的原始資料往往包含數十甚至數百個特徵,這在數學上稱為高維空間。然而,人類的視覺感官僅能直觀理解二維(平面)或三維(空間)的圖形。因此,資料維度降維(Dimensionality Reduction)便成為視覺化的核心前置步驟。透過如 PCA 或 t-SNE 等演算法,我們能將資料從 $n$ 維投影到 $k$ 維(其中 $k \le 3$),並儘可能保留資料原始的結構與分布,讓我們能在螢幕上觀察到資料的群聚與趨勢。
▼ 還有更多解析內容