moea_joint_essay 107年 [統計資訊] 資料庫及資料探勘、程式設計

第二題

📖 題組：
針對各類資料探勘工具的使用與計算，請回答下列問題：（每小題 5 分，共 15 分）

📝 此題為申論題，共 3 小題

小題 (二)

在相關規則的計算中，假設 A、B、C、D 與 E 代表各 item，如果在所有 2-itemset 中，只有{A,B}、{B,C}、{A,D}、{A,C}、{C,D}是頻繁項目集(frequent itemset)，請問 3-itemset 有哪些可能是 frequent itemset？

思路引導 VIP

利用 Apriori 演算法的特性：一個項目集是頻繁的，則其所有的子集也必須是頻繁的。檢查由頻繁 2-itemset 組合的可能 3-itemset 候選集。

🤖

AI 詳解

AI 專屬家教

根據 Apriori 演算法的向下封閉性（Apriori Property），如果一個項目集是 Frequent itemset，則其所有的子集也必須是 Frequent itemset。我們檢查可能組合出的 3-itemset 及其所有 2-itemset 子集是否都在頻繁列表中：

候選 {A,B,C}：其子集為 {A,B}、{A,C}、{B,C}，皆為頻繁 2-itemset。因此 {A,B,C} 有可能是 frequent itemset。

小題 (一)

假設使用 feed-forward back-propagation neural network 建構了一個分類器，後來發現此分類器有 overfitting 的現象發生。如果想透過修改此類神經網路的拓譜(topology)來避免分類器的 overfitting 現象，請問可以如何做？

思路引導 VIP

可透過減少網路參數與複雜度的方法來避免 overfitting，主要方向為減少隱藏層層數或神經元數量。

🤖

AI 詳解

AI 專屬家教

為避免類神經網路產生過度擬合 (Overfitting) 的現象，在網路拓譜結構 (Topology) 上可以進行以下修改以降低模型複雜度：

減少隱藏層的層數 (Number of hidden layers)。
減少各隱藏層內的神經元數量 (Number of nodes/neurons in hidden layers)。

小題 (三)

針對一交易資料集，假設項目 A、B、C 的 support 值是 A=50%、B=80%、C=60%，2-itemset 的 support 值是{A,B}=35%、{B,C}=32%、{A,C}=10%，如果設定 minimum support=25%、minimum confidence=50%，請問此資料集有哪些相關規則？

思路引導 VIP

先過濾出滿足 min_support=25% 的頻繁 2-itemset，然後為這些頻繁項集產生關聯規則，並計算信賴度(Confidence = supp(X,Y)/supp(X))，篩選出 >= 50% 的規則。

🤖

AI 詳解

AI 專屬家教

篩選頻繁項目集（Minimum Support = 25%）：

{A,B} support = 35% (>= 25%，保留)
{B,C} support = 32% (>= 25%，保留)

🏷️ 相關主題

資料探勘中的分類與分群演算法應用

查看更多「[統計資訊] 資料庫及資料探勘、程式設計」的主題分類考古題

📝 同份考卷的其他題目

查看 107年[統計資訊] 資料庫及資料探勘、程式設計全題

第 二 題

小題 (二)

思路引導 VIP

小題 (一)

思路引導 VIP

小題 (三)

思路引導 VIP

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目

第二題