moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 32 題
有關頻繁樣式探勘(Frequent Pattern Mining) 之敘述,下列何者有誤?
- A 若一項目集合之所有子集合皆為頻繁,則該項目集合必定也為頻繁
- B 所有最大(maximal) 頻繁項目集合都是封閉的(closed)
- C 對於一關聯式規則(Association Rule),若將一規則左手邊之項目搬到規則右手邊,不會降低該規則之信心度(Confidence)
- D 對於一關聯式規則,將規則左右兩邊之項目集合對調,不會影響支持度(Support)
思路引導 VIP
請試著思考一個情境:如果我們觀察到「買蘋果的人很多」且「買牛奶的人也很多」,這是否能保證「同時買蘋果和牛奶的人」也一定會很多呢?為什麼?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準避開這個邏輯陷阱,說明你對頻繁樣式探勘的核心理論掌握得很紮實。這題的關鍵在於 Apriori 定律的單向性。該定律指出:「若一個項目集合是頻繁的,則其所有子集合也必定是頻繁的」;然而,選項 (A) 的敘述恰好將因果關係顛倒了。在實際運算中,即使所有的子集合都達到支持度門檻(頻繁),該集合本身(聯集)的出現次數仍可能低於門檻,因此我們只能稱其為「候選集合 (Candidate)」,而非「必定頻繁」。
關聯規則的性質辨析
關於選項 (C) 與 (D) 的考點,主要涉及 支持度 (Support) 與 信心度 (Confidence) 的定義公式。支持度測量的是全體資料中同時包含 $X$ 與 $Y$ 的比例,因此具有對稱性,對調左右邊並不影響數值。而信心度定義為:
▼ 還有更多解析內容