普考申論題
114年
[圖書資訊管理] 資訊系統與資訊檢索概要
第 一 題
📖 題組:
三、以下是一個典型的混淆矩陣(Confusion Matrix) 判定為正類 P | 判定為負類 N 實際為正類 P | TP(正確判定為正類) | FN(誤判正類為負類) 實際為負類 N | FP(誤判負類為正類) | TN(正確判定為負類) (一)若將其應用於資訊檢索系統之成效評估時,試闡述其中的 TP、FP、FN、TN 所代表之意涵。(20 分) (二)假設 TP=40、FP=10、FN=15、TN=35,試問資訊檢索之查準率(Precision,又稱精確率)與查全率(Recall,又稱回收率)分別為多少?(5 分)
三、以下是一個典型的混淆矩陣(Confusion Matrix) 判定為正類 P | 判定為負類 N 實際為正類 P | TP(正確判定為正類) | FN(誤判正類為負類) 實際為負類 N | FP(誤判負類為正類) | TN(正確判定為負類) (一)若將其應用於資訊檢索系統之成效評估時,試闡述其中的 TP、FP、FN、TN 所代表之意涵。(20 分) (二)假設 TP=40、FP=10、FN=15、TN=35,試問資訊檢索之查準率(Precision,又稱精確率)與查全率(Recall,又稱回收率)分別為多少?(5 分)
📝 此題為申論題,共 2 小題
小題 (一)
若將其應用於資訊檢索系統之成效評估時,試闡述其中的 TP、FP、FN、TN 所代表之意涵。(20 分)
思路引導 VIP
本題測驗核心為『混淆矩陣在資訊檢索(IR)領域的意義轉換』。解題第一步需將矩陣的『正/負類』對應到IR的『相關/不相關』與『檢索出/未檢索出』;第二步則代入查準率(看重系統挑出的品質)與查全率(看重相關文件的涵蓋率)之經典公式,進行數值計算並附上精確定義。
小題 (二)
假設 TP=40、FP=10、FN=15、TN=35,試問資訊檢索之查準率(Precision,又稱精確率)與查全率(Recall,又稱回收率)分別為多少?(5 分)
思路引導 VIP
看到此題,應立即回想資訊檢索中評估指標的定義與公式:查準率(Precision)評估「撈出來的有多準」,公式為 TP / (TP + FP);查全率(Recall)評估「該撈的撈出多少」,公式為 TP / (TP + FN)。將題目給定的數值代入公式計算即可得分。
混淆矩陣與檢索效能
💡 利用混淆矩陣定義查準率與查全率,評估資訊檢索系統之成效。
| 比較維度 | 查準率 (Precision) | VS | 查全率 (Recall) |
|---|---|---|---|
| 核心意義 | 檢出結果的精確度 | — | 相關文獻的涵蓋度 |
| 計算分母 | 所有檢出之文獻(TP+FP) | — | 系統內所有相關文獻(TP+FN) |
| 降低目標 | 降低 FP (誤檢量) | — | 降低 FN (漏檢量) |
| 使用者需求 | 不想看到無關資料 | — | 想找齊所有相關資料 |
💬兩者通常呈反比關係,評估時需視檢索目的在準確與全面間取捨。