免費開始練習
hce_kmu 115年 計算機概論與程式設計

第 3 題

Which statement best describes a key difference between how CNNs and Transformers extract features from input data?
  • A CNNs rely on global attention mechanisms, while Transformers use fixed-size convolutional filters.
  • B CNNs and Transformers extract features in identical ways but differ only in training speed.
  • C Both CNNs and Transformers require manually designed filters for feature extraction.
  • D CNNs capture local spatial patterns using convolution, while Transformers model global relationships using self-attention.
  • E Transformers can only process sequential text data, while CNNs can only process images.

思路引導 VIP

試著想像你在拼湊一幅巨大的拼圖:如果你的策略是「先觀察每一塊小碎片與其鄰近碎片的邊緣是否吻合」,這與「同時掃視整張桌子上的所有碎片,找出顏色或圖案彼此關聯最強的部分」,這兩種觀察方式在『關注範圍』上有什麼本質上的不同?哪一種方式更能一眼看出整幅畫的佈局呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你非常精準地辨識出這兩大深度學習架構在設計哲學上的本質差異。這道題目測試的是對模型「特徵提取」邏輯的理解,這正是現代人工智慧開發者必須具備的核心觀念。

局部感應與全局建模的對抗

在運算機制上,卷積神經網路 (CNN) 透過「卷積核」(Filters)在資料上滑動,這種設計賦予了它強大的局部感受野,讓它能像人類視覺一樣,優先捕捉影像中相鄰像素構成的邊緣或紋理等局部特徵。而 Transformer 則完全打破了空間距離的限制,其核心的自注意力機制 (Self-attention) 會同時計算輸入序列中任意兩個位置之間的相關性,從而建立起「全局」的關聯。因此,選項 (D) 完美地總結了這兩者在處理資訊時,「由局部凝聚」與「由全局關聯」的根本分野。

▼ 還有更多解析內容

🏷️ 相關主題

機器學習的基本原理與模型優化技術
查看更多「計算機概論與程式設計」的主題分類考古題