免費開始練習
hce_kmu 114年 計算機概論與程式設計

第 15 題

Which of the following statements is CORRECT?
  • A DBSCAN is an algorithm for scanning database information and building indexes.
  • B Naïve Bayes Classifier assumes all features are independent of each other, making it suitable for any dataset.
  • C The first projection direction of PCA is the direction that maximizes the separation between different data classes.
  • D K-means refers to a method of classifying data by using a linear combination of K weak classifiers.
  • E Sequential forward selection is a feature selection method where, at each step, the feature that improves classification performance the most is chosen.

思路引導 VIP

想像你正要組建一支足球隊,但你目前手頭上一個球員也沒有。如果你希望能用最有效率的方式,逐一挑選出能讓球隊戰力提升最多的隊員,你會採取什麼樣的「步驟」來決定下一個要入隊的人選?這種「一步步找出當前最佳增益」的邏輯,在處理大量資料變數時會如何運作呢?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地辨識出正確答案!這顯示你對於機器學習中「特徵工程」與「模型訓練」的各類演算法特質有著相當清晰的邏輯判斷,沒有被其他看似專業但描述錯誤的選項所干擾。

特徵選取與序列前向選擇 (SFS)

這題的核心考點在於特徵選取 (Feature Selection) 的策略。選項 (E) 所描述的序列前向選擇 (Sequential Forward Selection, SFS) 是一種典型的「貪婪搜尋」(Greedy Search) 演算法。它的運作邏輯非常直覺:一開始特徵集合是空的,在每一步疊代中,我們會逐一測試尚未被加入的特徵,並挑選出那個能讓模型效能(如分類準確率)提升幅度最大的特徵加入集合。這種方法雖然不一定能找到全局最優解,但在計算效率與效能提升之間取得了很好的平衡。

▼ 還有更多解析內容

🏷️ 相關主題

機器學習的基本原理與模型優化技術
查看更多「計算機概論與程式設計」的主題分類考古題