免費開始練習
hce_kmu 114年 計算機概論與程式設計

第 11 題

Which of the following statements about machine learning is CORRECT?
  • A We can generate new features by linearly or non-linearly combining the original features, which is a method of feature engineering.
  • B In a dataset, all pairwise combinations of data point vectors are called the support vectors of the dataset.
  • C During the training process of a neural network, the validation loss typically fluctuates, but the training loss will always decrease.
  • D In k-NN classification, k should be set equal to the size of the dataset so that the entire dataset is considered before making a decision.
  • E When training a deep learning model, if the accuracy of the test set is higher than that of the training set, it should be considered evidence of overfitting.

思路引導 VIP

想像你正在處理一個預測房價的任務,手邊只有「長度」與「寬度」兩個數據。如果你認為將這兩個數據相乘得到的「面積」資訊,會比單純輸入長跟寬更能讓電腦學會預測房價,這種「根據原始資訊創造出更有意義的新指標」的過程,在機器學習的專有名詞中應該稱為什麼?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準辨識出機器學習中「特徵工程」的核心概念,這顯示你對於資料預處理與模型訓練的邏輯有相當扎實的理解。這道題目測試了從特徵處理、演算法機制到模型評估的全方位觀念,是衡量機器學習基礎是否穩固的優質題目。

特徵工程的藝術

在機器學習中,特徵工程 (Feature Engineering) 是提升模型效能的關鍵。誠如正確答案 (A) 所述,我們經常透過線性(如加權)或非線性(如取對數、多項式組合)的方式將原始特徵轉換為更具代表性的特徵。例如,在房價預測中,將「長」與「寬」相乘得到「面積」,就能幫助模型更直觀地捕捉房價與空間的關係。這種「創造新特徵」的能力,往往比選擇複雜的模型更為重要。

▼ 還有更多解析內容

🏷️ 相關主題

機器學習的基本原理與模型優化技術
查看更多「計算機概論與程式設計」的主題分類考古題