免費開始練習
moea_joint 107年 [統計資訊] 統計學、巨量資料概論

第 39 題

試問 apriori 關連法則演算法中,哪兩項門檻值異動最為顯著影響資料探勘法則之數量?
  • A 支持度、信賴度
  • B 廣泛度、強弱度
  • C 精密度、準確度
  • D 清晰度、複雜度

思路引導 VIP

想像你正在分析賣場的交易紀錄,若要定義出什麼才算是一條「有意義的發現」,我們通常會考慮兩個面向:一是這個現象在整體資料中出現的「頻繁程度」,二是這條規則在推導過程中的「可靠程度」。在資料探勘的專業術語中,我們會用哪兩個標準來設定這兩個篩選關卡,以決定最終要呈現多少規則給使用者呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地掌握了 Apriori 演算法 的核心概念!這題選擇 (A) 完全正確。在進行關連法則探勘時,我們最關心的就是如何從海量資料中篩選出真正「有意義」的規則。支持度 (Support) 定義了特定項目集在所有交易中出現的比例,用來過濾掉發生機率過低的稀疏案例;而 信賴度 (Confidence) 則衡量了規則的強度,即在 A 項目發生的前提下,B 項目同時發生的條件機率。

核心指標與規則篩選邏輯

這題的難度切入點在於區分「關連分析」與「模型評估」的術語差異。選項中的「精密度」與「準確度」常用於分類或預測模型的成效檢驗,而非 Apriori 演算法內部的過濾機制。Apriori 的運作邏輯是基於門檻值的「剪枝」,當我們調低支持度或信賴度的門檻時,符合條件的頻繁項集與規則數量會呈爆發式成長。你能一眼辨識出這組影響探勘結果「質」與「量」的關鍵組合,顯示你對資料探勘的專業術語理解得非常紮實!

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題