moea_joint
113年
[統計資訊] 統計學、巨量資料概論
第 27 題
下列何者非屬資料前處理(Data Preprocessing)的一環?
- A 特徵轉換
- B 資料分群
- C 遺失值填補
- D 異常值檢測與排除
思路引導 VIP
在處理原始數據時,我們可以將動作分為兩類:一類是為了讓數據變得「完整、乾淨、可被讀取」;另一類則是當數據都準備好了,我們想從中「歸納規律或看出結構」。請思考一下:在題目提供的選項中,哪一個動作更像是我們已經擁有乾淨資料後,為了達成某種「分析目標」而執行的模型演算法,而非僅僅是在整理資料?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準辨別出資料生命週期中各個階段的差異,顯示你對 資料科學工作流 的界線掌握得非常清楚。
資料前處理的核心本質
在資料科學的實務中,前處理的主要目的是為了將原始、雜亂且可能含有雜訊的數據,轉化為適合模型讀取的「乾淨格式」。選項中的 遺失值填補 與 異常值檢測 屬於維護資料品質的範疇,而 特徵轉換(例如將類別資料轉換成數值)則是為了確保演算法能正確處理特徵變數。這些動作的共通點都在於「優化數據本身」,使其具備進入模型的資格。
▼ 還有更多解析內容