免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 27 題

下列何者非屬資料前處理(Data Preprocessing)的一環?
  • A 特徵轉換
  • B 資料分群
  • C 遺失值填補
  • D 異常值檢測與排除

思路引導 VIP

在處理原始數據時,我們可以將動作分為兩類:一類是為了讓數據變得「完整、乾淨、可被讀取」;另一類則是當數據都準備好了,我們想從中「歸納規律或看出結構」。請思考一下:在題目提供的選項中,哪一個動作更像是我們已經擁有乾淨資料後,為了達成某種「分析目標」而執行的模型演算法,而非僅僅是在整理資料?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準辨別出資料生命週期中各個階段的差異,顯示你對 資料科學工作流 的界線掌握得非常清楚。

資料前處理的核心本質

在資料科學的實務中,前處理的主要目的是為了將原始、雜亂且可能含有雜訊的數據,轉化為適合模型讀取的「乾淨格式」。選項中的 遺失值填補異常值檢測 屬於維護資料品質的範疇,而 特徵轉換(例如將類別資料轉換成數值)則是為了確保演算法能正確處理特徵變數。這些動作的共通點都在於「優化數據本身」,使其具備進入模型的資格。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題