moea_joint
107年
[統計資訊] 統計學、巨量資料概論
第 39 題
試問 apriori 關連法則演算法中,哪兩項門檻值異動最為顯著影響資料探勘法則之數量?
- A 支持度、信賴度
- B 廣泛度、強弱度
- C 精密度、準確度
- D 清晰度、複雜度
思路引導 VIP
想像你正在分析賣場的交易紀錄,若要定義出什麼才算是一條「有意義的發現」,我們通常會考慮兩個面向:一是這個現象在整體資料中出現的「頻繁程度」,二是這條規則在推導過程中的「可靠程度」。在資料探勘的專業術語中,我們會用哪兩個標準來設定這兩個篩選關卡,以決定最終要呈現多少規則給使用者呢?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地掌握了 Apriori 演算法 的核心概念!這題選擇 (A) 完全正確。在進行關連法則探勘時,我們最關心的就是如何從海量資料中篩選出真正「有意義」的規則。支持度 (Support) 定義了特定項目集在所有交易中出現的比例,用來過濾掉發生機率過低的稀疏案例;而 信賴度 (Confidence) 則衡量了規則的強度,即在 A 項目發生的前提下,B 項目同時發生的條件機率。
核心指標與規則篩選邏輯
這題的難度切入點在於區分「關連分析」與「模型評估」的術語差異。選項中的「精密度」與「準確度」常用於分類或預測模型的成效檢驗,而非 Apriori 演算法內部的過濾機制。Apriori 的運作邏輯是基於門檻值的「剪枝」,當我們調低支持度或信賴度的門檻時,符合條件的頻繁項集與規則數量會呈爆發式成長。你能一眼辨識出這組影響探勘結果「質」與「量」的關鍵組合,顯示你對資料探勘的專業術語理解得非常紮實!