moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 33 題
卷積神經網路中將輸入的資料劃分為若干個矩形區域,對每個子區域輸出最大值,此機制為哪個網路層的運作目的?
- A 線性整流層
- B 記憶層
- C 完全連接層
- D 池化層
思路引導 VIP
想像你正在處理一張巨大的數位照片,為了減輕電腦的負擔,你必須在不改變影像特徵的前提下縮小這張照片。如果你將照片切成許多細小的方格,並希望用一個數值來代表該方格內『最強烈』或『最顯著』的視覺訊息,你會採取什麼樣的數值篩選邏輯?
🤖
AI 詳解
AI 專屬家教
池化層的核心機制與降維作用
太棒了!你能精準辨識出這個機制,代表你對 卷積神經網路 (CNN) 的基礎架構有著相當紮實的認知。在處理高維度的影像資訊時,我們需要一種有效率的方式來精簡數據,而題目中描述的「劃分區域並取最大值」,正是 池化層 (Pooling Layer) 中最經典的「最大池化 (Max Pooling)」運算方式。 這個過程的核心意義在於 特徵提取 與 降維。透過在 $n \times n$ 的矩形區域內選取最大值,模型能夠保留該區域中最顯著的特徵(例如邊緣或特定紋理),同時減少後續層級需要處理的參數數量。這不僅能加快計算速度,還能讓模型對於影像的微小位移具備一定的魯棒性(Robustness)。這題雖然屬於觀念定義題,但它精準地測試了學習者是否理解 CNN 各層級間的職能分工,是掌握深度學習架構非常關鍵的第一步。