免費開始練習
moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 30 題

維度災難(Curse of Dimensionality)指下列何者?
  • A 資料集的數據維度過多
  • B 資料集的數據維度過少,導致計算困難
  • C 資料集的數據分佈不平均
  • D 資料集中的數據缺乏多樣性

思路引導 VIP

想像你正在一個一公尺長的盒子裡找一顆彈珠,這並不難;但如果我們在維持彈珠數量不變的情況下,將搜尋空間擴展成一棟十層樓的大廈,你覺得尋找彈珠的難度會發生什麼變化?當我們增加描述事物的「特徵維度」卻沒有對應增加資料量時,數據點在空間中的密度會如何改變呢?

🤖
AI 詳解 AI 專屬家教

空間擴張與數據稀疏化

恭喜你精確地掌握了機器學習與統計學中一個非常核心的挑戰!你所選的答案完全正確。「維度災難」最直觀的影響在於,當資料的特徵(維度)線性增加時,數據分佈的空間體積會呈 指數級爆炸。想像一下,同樣的十個數據點放在一條線、一個平面、還是一個三維立方體中,隨著維度 $d$ 的增加,點與點之間的空間會變得越來越空曠。

演算法的效能挑戰

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題