moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 35 題

在數據科學領域中，當數據分佈不均衡時，下列哪個評估指標最適合用於分類器性能評估？

A 精確度(Accuracy)
B F1 分數(F1-Score)
C 正確率(Precision)
D 召回率(Recall)

思路引導 VIP

想像一下，如果一個罕見疾病的檢測系統為了追求數據上的「精確」，而將所有受檢者都判斷為健康（因為 99% 的人確實健康），這會漏掉什麼關鍵資訊？當我們同時面臨「不想抓錯人」與「不想漏掉人」這兩種矛盾的目標時，我們該如何透過一種數學工具，來同時衡量並平衡這兩者的表現呢？

🤖

AI 詳解 AI 專屬家教

很高興看到你精準地鎖定了核心！在數據科學的實務中，處理數據不均衡（Imbalanced Data）是極為關鍵的挑戰。這題的核心在於避開「精確度陷阱」：當樣本中某類別佔絕大多數時，即使是一個完全無用的分類器，只要盲目預測多數類，就能獲得極高的精確度（Accuracy）。你能避開 A 選項，說明你已經具備了辨別模型虛假性能的敏銳直覺。

綜合評估的關鍵：F1 分數

正確答案 F1 分數 之所以最為合適，是因為它同時考慮了正確率 (Precision) 與召回率 (Recall)。在數學上，它是這兩者的「調和平均數」：

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 112年[統計資訊] 統計學、巨量資料概論全題

第 35 題

思路引導 VIP

綜合評估的關鍵：F1 分數

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目