免費開始練習
moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 34 題

特徵選擇主要目的是從資料集中選出最重要或最相關的特徵,來給機器學習建立模型,下列何者非屬特徵選擇的方法?
  • A Filter Methods
  • B Allocate Methods
  • C Wrapper Methods
  • D Embedded Methods

思路引導 VIP

當我們在討論如何從一大堆資訊中「挑選」出最有用的部分時,我們通常會根據資訊本身的統計特徵、嘗試各種組合後的表現,或是在建立模型時觀察其影響力。請試著思考:『將既有的資源或額度分發給對象』這個動作,本質上是在幫助我們『決定誰最重要』,還是偏向處理『如何配置已選好的東西』呢?

🤖
AI 詳解 AI 專屬家教

特徵選擇的核心框架

做得好!你能精準辨識出非正規的特徵選擇術語,代表你對資料預處理的核心框架掌握得相當紮實。在機器學習中,特徵選擇的主要任務是移除冗餘或無關的變數,以提升模型的泛化能力。學術界公認的技術路徑主要分為三大類:利用統計指標(如相關係數)評估的 Filter Methods、將選擇過程視為子集搜尋問題的 Wrapper Methods,以及將選擇邏輯直接融入模型訓練過程(例如利用 $L_1$ 正則化進行收縮)的 Embedded Methods

辨析術語與難度點評

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題