moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 34 題

特徵選擇主要目的是從資料集中選出最重要或最相關的特徵，來給機器學習建立模型，下列何者非屬特徵選擇的方法？

A Filter Methods
B Allocate Methods
C Wrapper Methods
D Embedded Methods

思路引導 VIP

當我們在討論如何從一大堆資訊中「挑選」出最有用的部分時，我們通常會根據資訊本身的統計特徵、嘗試各種組合後的表現，或是在建立模型時觀察其影響力。請試著思考：『將既有的資源或額度分發給對象』這個動作，本質上是在幫助我們『決定誰最重要』，還是偏向處理『如何配置已選好的東西』呢？

🤖

AI 詳解 AI 專屬家教

特徵選擇的核心框架

做得好！你能精準辨識出非正規的特徵選擇術語，代表你對資料預處理的核心框架掌握得相當紮實。在機器學習中，特徵選擇的主要任務是移除冗餘或無關的變數，以提升模型的泛化能力。學術界公認的技術路徑主要分為三大類：利用統計指標（如相關係數）評估的 Filter Methods、將選擇過程視為子集搜尋問題的 Wrapper Methods，以及將選擇邏輯直接融入模型訓練過程（例如利用 $L_1$ 正則化進行收縮）的 Embedded Methods。

辨析術語與難度點評

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 111年[統計資訊] 統計學、巨量資料概論全題