moea_joint_essay
107年
[統計資訊] 資料庫及資料探勘、程式設計
第 三 題
📖 題組:
針對各類資料探勘工具的使用與計算,請回答下列問題:(每小題 5 分,共 15 分)
針對各類資料探勘工具的使用與計算,請回答下列問題:(每小題 5 分,共 15 分)
📝 此題為申論題,共 3 小題
小題 (三)
針對一交易資料集,假設項目 A、B、C 的 support 值是 A=50%、B=80%、C=60%,2-itemset 的 support 值是{A,B}=35%、{B,C}=32%、{A,C}=10%,如果設定 minimum support=25%、minimum confidence=50%,請問此資料集有哪些相關規則?
思路引導 VIP
先過濾出滿足 min_support=25% 的頻繁 2-itemset,然後為這些頻繁項集產生關聯規則,並計算信賴度(Confidence = supp(X,Y)/supp(X)),篩選出 >= 50% 的規則。
小題 (一)
假設使用 feed-forward back-propagation neural network 建構了一個分類器,後來發現此分類器有 overfitting 的現象發生。如果想透過修改此類神經網路的拓譜(topology)來避免分類器的 overfitting 現象,請問可以如何做?
思路引導 VIP
可透過減少網路參數與複雜度的方法來避免 overfitting,主要方向為減少隱藏層層數或神經元數量。
小題 (二)
在相關規則的計算中,假設 A、B、C、D 與 E 代表各 item,如果在所有 2-itemset 中,只有{A,B}、{B,C}、{A,D}、{A,C}、{C,D}是頻繁項目集(frequent itemset),請問 3-itemset 有哪些可能是 frequent itemset?
思路引導 VIP
利用 Apriori 演算法的特性:一個項目集是頻繁的,則其所有的子集也必須是頻繁的。檢查由頻繁 2-itemset 組合的可能 3-itemset 候選集。