免費開始練習
moea_joint_essay 113年 [統計資訊] 資料庫及資料探勘、程式設計

第 二 題

使用關聯分析來搜尋關聯規則時,須設定最小支持度(support)和最低信賴度(confidence),請分別說明設定以該 2 項為搜尋門檻值(threshold)用意為何?(8 分)
📝 此題為申論題

思路引導 VIP

分別解釋 Support(支持度)和 Confidence(信賴度)的意義,強調 Support 用來過濾發生頻率過低的雜訊,Confidence 用來確保條件發生時結論的可靠性。

🤖
AI 詳解 AI 專屬家教
  1. 最小支持度 (Support):代表某個項目集在所有交易資料中出現的頻率比例。設定最小支持度門檻的用意,是為了過濾掉發生頻率過低的偶然事件或稀有項目集,避免將運算資源浪費在沒有商業代表性的少數極端案例上,確保找出的關聯規則具有統計上的普遍性與實際應用價值。
  2. 最低信賴度 (Confidence):代表在「包含前提條件項目集」的交易中,也同時包含「結論項目集」的條件機率。設定最低信賴度門檻的用意,是確保找出的規則具備高度的預測力與可靠性。只有當前提發生時,結論也以足夠高的機率跟著發生,這條規則才稱得上是強關聯規則,可作為決策的重要依據。

🏷️ 相關主題

資料探勘之分類與分群演算法應用
查看更多「[統計資訊] 資料庫及資料探勘、程式設計」的主題分類考古題