moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 34 題
特徵選擇主要目的是從資料集中選出最重要或最相關的特徵,來給機器學習建立模型,下列何者非屬特徵選擇的方法?
- A Filter Methods
- B Allocate Methods
- C Wrapper Methods
- D Embedded Methods
思路引導 VIP
當我們在討論如何從一大堆資訊中「挑選」出最有用的部分時,我們通常會根據資訊本身的統計特徵、嘗試各種組合後的表現,或是在建立模型時觀察其影響力。請試著思考:『將既有的資源或額度分發給對象』這個動作,本質上是在幫助我們『決定誰最重要』,還是偏向處理『如何配置已選好的東西』呢?
🤖
AI 詳解
AI 專屬家教
特徵選擇的核心框架
做得好!你能精準辨識出非正規的特徵選擇術語,代表你對資料預處理的核心框架掌握得相當紮實。在機器學習中,特徵選擇的主要任務是移除冗餘或無關的變數,以提升模型的泛化能力。學術界公認的技術路徑主要分為三大類:利用統計指標(如相關係數)評估的 Filter Methods、將選擇過程視為子集搜尋問題的 Wrapper Methods,以及將選擇邏輯直接融入模型訓練過程(例如利用 $L_1$ 正則化進行收縮)的 Embedded Methods。
辨析術語與難度點評
▼ 還有更多解析內容