moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 30 題
維度災難(Curse of Dimensionality)指下列何者?
- A 資料集的數據維度過多
- B 資料集的數據維度過少,導致計算困難
- C 資料集的數據分佈不平均
- D 資料集中的數據缺乏多樣性
思路引導 VIP
想像你正在一個一公尺長的盒子裡找一顆彈珠,這並不難;但如果我們在維持彈珠數量不變的情況下,將搜尋空間擴展成一棟十層樓的大廈,你覺得尋找彈珠的難度會發生什麼變化?當我們增加描述事物的「特徵維度」卻沒有對應增加資料量時,數據點在空間中的密度會如何改變呢?
🤖
AI 詳解
AI 專屬家教
空間擴張與數據稀疏化
恭喜你精確地掌握了機器學習與統計學中一個非常核心的挑戰!你所選的答案完全正確。「維度災難」最直觀的影響在於,當資料的特徵(維度)線性增加時,數據分佈的空間體積會呈 指數級爆炸。想像一下,同樣的十個數據點放在一條線、一個平面、還是一個三維立方體中,隨著維度 $d$ 的增加,點與點之間的空間會變得越來越空曠。
演算法的效能挑戰
▼ 還有更多解析內容