moea_joint_essay
105年
[統計資訊] 資料庫及資料探勘、程式設計
第 一 題
📖 題組:
頻繁樣式探勘(Frequent Pattern Mining)的議題,最早於 1994 年由 Agrawa 與 Srikant 提出,目的在於透過分析顧客交易紀錄,了解產品被購買的規律性,並對此問題提出 Apriori Algorithm,利用頻繁樣式(frequent itemset)的向下封閉性質(downward closure property),有效解決產品間各種排列組合關係造成的高複雜度計算。
頻繁樣式探勘(Frequent Pattern Mining)的議題,最早於 1994 年由 Agrawa 與 Srikant 提出,目的在於透過分析顧客交易紀錄,了解產品被購買的規律性,並對此問題提出 Apriori Algorithm,利用頻繁樣式(frequent itemset)的向下封閉性質(downward closure property),有效解決產品間各種排列組合關係造成的高複雜度計算。
📝 此題為申論題,共 2 小題
小題 (一)
請簡述頻繁樣式的向下封閉性質。(5 分)
思路引導 VIP
解釋 Apriori 的核心精神:如果某個集合是頻繁的,那麼它的所有子集也一定頻繁;反過來說(用作剪枝),如果某個子集不頻繁,其所有超集也必定不頻繁。
小題 (二)
請利用 Apriori Algorithm 分析【表 2】顧客交易紀錄,詳列頻繁樣式探勘之過程與結果(假定最小支持(minimal support)為 2 次)。(15 分)
思路引導 VIP
逐層掃描:首先計算單一項目的計數 (C1) 並過濾出頻繁 1-項目集 (L1);接著互相組合出長度為 2 的候選集 (C2) 掃描過濾得到 L2;依此類推直至無法產生新的頻繁項目集。需詳列每個層級的過程。