免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 48 題

資料視覺化是資料處理中一項重要工作,通常資料視覺化需要使用到下列哪種方法?
  • A 資料維度降維
  • B 建立分類模型
  • C 建立迴歸模型
  • D 調整模型參數

思路引導 VIP

「想像一下,如果你手邊有一份包含 100 種特徵(例如身高、體重、年齡...等 100 項指標)的複雜客戶資料,而你現在只有一張平面的白紙可以繪圖。在不失真太多的前提下,你必須對這 100 個指標的『數量』做什麼樣的數學處理,才能讓資料點呈現在這張二維的紙上呢?」

🤖
AI 詳解 AI 專屬家教

恭喜你精準地選出了正確答案!這顯示你對大數據處理中的「視覺呈現限制」與「特徵工程」有著很紮實的觀念連結。

高維度資料的映射與呈現

在現實的資料科學情境中,我們處理的原始資料往往包含數十甚至數百個特徵,這在數學上稱為高維空間。然而,人類的視覺感官僅能直觀理解二維(平面)或三維(空間)的圖形。因此,資料維度降維(Dimensionality Reduction)便成為視覺化的核心前置步驟。透過如 PCA 或 t-SNE 等演算法,我們能將資料從 $n$ 維投影到 $k$ 維(其中 $k \le 3$),並儘可能保留資料原始的結構與分布,讓我們能在螢幕上觀察到資料的群聚與趨勢。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題