moea_joint_essay
110年
[統計資訊] 資料庫及資料探勘、程式設計
第 一 題
📖 題組:
資料探勘常用歐幾里得距離來定義相似度(或不相似度),資料前處理時,常需對每一欄位分別做正規化(或稱標準化)。(共 2 題,共 10 分)
資料探勘常用歐幾里得距離來定義相似度(或不相似度),資料前處理時,常需對每一欄位分別做正規化(或稱標準化)。(共 2 題,共 10 分)
📝 此題為申論題,共 2 小題
小題 (一)
請說明正規化之目的。(1 分)
思路引導 VIP
解釋為什麼要做正規化。主要是為了消除變數尺度的差異。
小題 (二)
請說明常用之 3 種正規化方法。(每個答案 3 分,共 9 分)
思路引導 VIP
常用的三種。Min-max, Z-score, Decimal scaling。