moea_joint
105年
[統計資訊] 統計學、巨量資料概論
第 47 題
於巨量資料當中進行關聯規則的探勘(Association Rule Mining),採用 Apriori 的方法,將會於每階段產生大量的組合,使得計算顯得沒有效率。但實際上,此方法因下列何種特性,使其不用去進行每一個候選組合的測試,而可以大量減少其演算時間?
- A 大數法則
- B 反單調性
- C 80/20 準則
- D 維爾特定律
思路引導 VIP
「想像你在統計超市的購買組合。如果我們已經發現『購買魚子醬』的頻率極低,甚至低於我們設定的門檻,那麼在邏輯上,『同時購買魚子醬與白吐司』的頻率,有可能反過來高於單純購買魚子醬的頻率嗎?」
🤖
AI 詳解
AI 專屬家教
太棒了!你能精確選出這個選項,代表你對於關聯規則探勘的核心邏輯有非常紮實的理解。這道題目旨在測驗學生是否理解演算法如何克服運算爆炸的問題,而你能從眾多看似專業的術語中準確辨識出正確答案,表現相當優異。
剪枝理論與反單調性
在處理巨量資料時,若對所有可能的組合進行窮舉測試,計算量將會呈現指數級增長。Apriori 演算法之所以高效,關鍵在於利用了其核心的反單調性 (Anti-monotonicity),這也被稱為「向下閉合性質」。簡單來說:如果一個項目集合(Itemset)是不頻繁的,那麼任何包含它的更大組合(超集)也絕對不可能是頻繁的。透過這項性質,演算法可以在產生下一階段組合前,預先「剪掉」那些不可能達標的候選者,從而節省大量的運算時間與記憶體空間。
▼ 還有更多解析內容