免費開始練習
moea_joint_essay 107年 [統計資訊] 資料庫及資料探勘、程式設計

第 二 題

📖 題組:
針對各類資料探勘工具的使用與計算,請回答下列問題:(每小題 5 分,共 15 分)
📝 此題為申論題,共 3 小題

小題 (二)

在相關規則的計算中,假設 A、B、C、D 與 E 代表各 item,如果在所有 2-itemset 中,只有{A,B}、{B,C}、{A,D}、{A,C}、{C,D}是頻繁項目集(frequent itemset),請問 3-itemset 有哪些可能是 frequent itemset?

思路引導 VIP

利用 Apriori 演算法的特性:一個項目集是頻繁的,則其所有的子集也必須是頻繁的。檢查由頻繁 2-itemset 組合的可能 3-itemset 候選集。

🤖
AI 詳解
AI 專屬家教

根據 Apriori 演算法的向下封閉性(Apriori Property),如果一個項目集是 Frequent itemset,則其所有的子集也必須是 Frequent itemset。 我們檢查可能組合出的 3-itemset 及其所有 2-itemset 子集是否都在頻繁列表中:

  1. 候選 {A,B,C}:其子集為 {A,B}、{A,C}、{B,C},皆為頻繁 2-itemset。因此 {A,B,C} 有可能是 frequent itemset。

小題 (一)

假設使用 feed-forward back-propagation neural network 建構了一個分類器,後來發現此分類器有 overfitting 的現象發生。如果想透過修改此類神經網路的拓譜(topology)來避免分類器的 overfitting 現象,請問可以如何做?

思路引導 VIP

可透過減少網路參數與複雜度的方法來避免 overfitting,主要方向為減少隱藏層層數或神經元數量。

🤖
AI 詳解
AI 專屬家教

為避免類神經網路產生過度擬合 (Overfitting) 的現象,在網路拓譜結構 (Topology) 上可以進行以下修改以降低模型複雜度:

  1. 減少隱藏層的層數 (Number of hidden layers)。
  2. 減少各隱藏層內的神經元數量 (Number of nodes/neurons in hidden layers)。

小題 (三)

針對一交易資料集,假設項目 A、B、C 的 support 值是 A=50%、B=80%、C=60%,2-itemset 的 support 值是{A,B}=35%、{B,C}=32%、{A,C}=10%,如果設定 minimum support=25%、minimum confidence=50%,請問此資料集有哪些相關規則?

思路引導 VIP

先過濾出滿足 min_support=25% 的頻繁 2-itemset,然後為這些頻繁項集產生關聯規則,並計算信賴度(Confidence = supp(X,Y)/supp(X)),篩選出 >= 50% 的規則。

🤖
AI 詳解
AI 專屬家教
  1. 篩選頻繁項目集(Minimum Support = 25%):
  • {A,B} support = 35% (>= 25%,保留)
  • {B,C} support = 32% (>= 25%,保留)

🏷️ 相關主題

資料探勘之分類與分群演算法應用
查看更多「[統計資訊] 資料庫及資料探勘、程式設計」的主題分類考古題