moea_joint_essay
109年
[統計資訊] 資料庫及資料探勘、程式設計
第 三 題
📖 題組:
若資料庫中有一客戶資料表(Table) CUSTOMER 如下。今利用此資料表訓練一倒傳遞類神經網路(Back Propagation Neural Network),使其可依客戶購買行為判別客戶性別,則應如何設計此類神經網路?請回答下列問題:(共 3 題,共 10 分) CUSTOMER ID Freq UnitPrice Amount Discount Payment Sex ID:客戶編號 Freq:購物頻率(平均每月購買次數) UnitPrice:單價(購買商品平均單價) Amount:每筆購物總價(平均單次購物總價) Discount:購物折扣率(所購商品平均折扣率) Payment:付款方式(主要付款方式:現金、信用卡、行動支付…) Sex:性別
若資料庫中有一客戶資料表(Table) CUSTOMER 如下。今利用此資料表訓練一倒傳遞類神經網路(Back Propagation Neural Network),使其可依客戶購買行為判別客戶性別,則應如何設計此類神經網路?請回答下列問題:(共 3 題,共 10 分) CUSTOMER ID Freq UnitPrice Amount Discount Payment Sex ID:客戶編號 Freq:購物頻率(平均每月購買次數) UnitPrice:單價(購買商品平均單價) Amount:每筆購物總價(平均單次購物總價) Discount:購物折扣率(所購商品平均折扣率) Payment:付款方式(主要付款方式:現金、信用卡、行動支付…) Sex:性別
📝 此題為申論題,共 3 小題
小題 (三)
如果資料庫中有 10 萬筆此種客戶資料,應如何運用這些資料做訓練及測試?(4 分)
思路引導 VIP
說明資料分割的比例 (如 8:2)、交叉驗證(Cross-Validation)、以及資料標準化/正規化等神經網路必要的前處理步驟。
小題 (一)
應於輸入層設計幾個神經元?為什麼?(3 分)
思路引導 VIP
考量哪些變數代表「購買行為」,需要排除沒有行為意義的變數(如 ID),而 Payment 為類別變數可能需進行 One-hot Encoding 展開處理。解釋清楚採用特徵的理由即可。
小題 (二)
應於輸出層設計幾個神經元?為什麼?(3 分)
思路引導 VIP
目標是預測性別,屬二元分類問題,輸出層設計 1 個或 2 個皆有其原由。