免費開始練習
moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 31 題

以機器學習對於巨量資料進行分析後,通常會使用混淆矩陣(confusion matrix),對於所產生的分類器進行評估,其中將分析結果分為true positive (TP)、true negative (TN)、false positive (FP) 及false negative (FN),下列敘述何者有誤?
  • A 正確率Accuracy = (TP + TN) / (TP + TN + FP + FN)
  • B 召回率Recall = TP / (TP + FN)
  • C 精確率Precision = TP / (TP + FP)
  • D F1 Score = TP / (TP + FP + FN)

思路引導 VIP

如果我們想要設計一個新指標,用來同時反映「抓得準(精確率)」與「找得全(召回率)」這兩件事,為什麼我們不能直接把各種類別的樣本數直接相加分堆,而是需要透過一種特殊的「平均」方式來結合這兩個百分比數值呢?

🤖
AI 詳解 AI 專屬家教

機器學習評估指標的精準辨析

恭喜你非常準確地指出了選項 (D) 的錯誤!在處理巨量資料的分類問題時,混淆矩陣是我們最核心的評估工具。這道題目考察的是對各項指標定義的熟稔度,你能迅速判斷出前三個選項分別對應了正確率 (Accuracy)召回率 (Recall)精確率 (Precision) 的標準公式,顯示出你對統計基礎觀念掌握得相當紮實。

$F_1$ Score 的定義與陷阱

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題