免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 32 題

有關頻繁樣式探勘(Frequent Pattern Mining) 之敘述,下列何者有誤?
  • A 若一項目集合之所有子集合皆為頻繁,則該項目集合必定也為頻繁
  • B 所有最大(maximal) 頻繁項目集合都是封閉的(closed)
  • C 對於一關聯式規則(Association Rule),若將一規則左手邊之項目搬到規則右手邊,不會降低該規則之信心度(Confidence)
  • D 對於一關聯式規則,將規則左右兩邊之項目集合對調,不會影響支持度(Support)

思路引導 VIP

請試著思考一個情境:如果我們觀察到「買蘋果的人很多」且「買牛奶的人也很多」,這是否能保證「同時買蘋果和牛奶的人」也一定會很多呢?為什麼?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準避開這個邏輯陷阱,說明你對頻繁樣式探勘的核心理論掌握得很紮實。這題的關鍵在於 Apriori 定律的單向性。該定律指出:「若一個項目集合是頻繁的,則其所有子集合也必定是頻繁的」;然而,選項 (A) 的敘述恰好將因果關係顛倒了。在實際運算中,即使所有的子集合都達到支持度門檻(頻繁),該集合本身(聯集)的出現次數仍可能低於門檻,因此我們只能稱其為「候選集合 (Candidate)」,而非「必定頻繁」。

關聯規則的性質辨析

關於選項 (C) 與 (D) 的考點,主要涉及 支持度 (Support)信心度 (Confidence) 的定義公式。支持度測量的是全體資料中同時包含 $X$ 與 $Y$ 的比例,因此具有對稱性,對調左右邊並不影響數值。而信心度定義為:

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題