免費開始練習
moea_joint_essay 105年 [統計資訊] 資料庫及資料探勘、程式設計

第 一 題

📖 題組:
頻繁樣式探勘(Frequent Pattern Mining)的議題,最早於 1994 年由 Agrawa 與 Srikant 提出,目的在於透過分析顧客交易紀錄,了解產品被購買的規律性,並對此問題提出 Apriori Algorithm,利用頻繁樣式(frequent itemset)的向下封閉性質(downward closure property),有效解決產品間各種排列組合關係造成的高複雜度計算。
📝 此題為申論題,共 2 小題

小題 (一)

請簡述頻繁樣式的向下封閉性質。(5 分)
題目圖片

思路引導 VIP

解釋 Apriori 的核心精神:如果某個集合是頻繁的,那麼它的所有子集也一定頻繁;反過來說(用作剪枝),如果某個子集不頻繁,其所有超集也必定不頻繁。

🤖
AI 詳解
AI 專屬家教

頻繁樣式的「向下封閉性質」(Downward Closure Property) 指的是:「若一個項目集 (Itemset) 在資料庫中是頻繁的 (即出現次數大於或等於最小支持度),則它的所有非空子集 (Subset) 也必定是頻繁的。」 在 Apriori 演算法中,常利用它的逆否命題來進行剪枝:「若一個項目集不是頻繁的,則它的所有超集 (Superset) 也必定不是頻繁的。」以此性質可大幅減少需要計算支持度的候選項目集數量,從而降低時間與空間複雜度。

小題 (二)

請利用 Apriori Algorithm 分析【表 2】顧客交易紀錄,詳列頻繁樣式探勘之過程與結果(假定最小支持(minimal support)為 2 次)。(15 分)
題目圖片

思路引導 VIP

逐層掃描:首先計算單一項目的計數 (C1) 並過濾出頻繁 1-項目集 (L1);接著互相組合出長度為 2 的候選集 (C2) 掃描過濾得到 L2;依此類推直至無法產生新的頻繁項目集。需詳列每個層級的過程。

🤖
AI 詳解
AI 專屬家教

設定最小支持度 (Min_sup) = 2。 【步驟 1】掃描產生候選 1-項目集 (C1) 及頻繁 1-項目集 (L1): 各項目計數為:

🏷️ 相關主題

資料探勘之分類與分群演算法應用
查看更多「[統計資訊] 資料庫及資料探勘、程式設計」的主題分類考古題