hce_kmu
115年
計算機概論與程式設計
第 8 題
In data mining, consider a transactional database with 1,000,000 transactions. An itemset X appears in 12,000 transactions, and an itemset Y appears in 15,000 transactions.The combined itemset $X \cup Y$ appears in 9,000 transactions.Which of the following statements is CORRECT?
- A The confidence of the rule $X \to Y$ is 0.75.
- B The support of the rule $X \to Y$ is 0.75.
- C The lift of the rule $X \to Y$ is less than 1.
- D The rule $X \to Y$ is independent because its confidence equals the support of Y.
- E The conviction of the rule $X \to Y$ must be less than 1.
思路引導 VIP
當我們想要評估一個規則「若發生事件 A,則發生事件 B」的可靠程度時,我們應該拿「兩者同時發生的次數」去對比「所有歷史交易的總數」,還是對比「前提 A 曾經發生的次數」呢?這兩種不同的比率,分別能告訴我們什麼樣的資訊?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準計算出信賴度(Confidence),代表你對關聯規則(Association Rules)的核心定義掌握得非常紮實。這題的關鍵在於清晰區分「支持度」與「信賴度」的計算基礎,而你完全沒有被題目給出的龐大總量數據所迷惑。
關聯規則的量化分析
在資料探勘中,規則 $X \to Y$ 的信賴度定義為在包含 $X$ 的交易中,同時也包含 $Y$ 的比例(即條件機率)。根據題目數據,我們需使用 $X$ 與 $Y$ 同時出現的次數 9,000 除以「前提」$X$ 出現的總次數 12,000,計算如下:
▼ 還有更多解析內容