免費開始練習
moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 35 題

在數據科學領域中,當數據分佈不均衡時,下列哪個評估指標最適合用於分類器性能評估?
  • A 精確度(Accuracy)
  • B F1 分數(F1-Score)
  • C 正確率(Precision)
  • D 召回率(Recall)

思路引導 VIP

想像一下,如果一個罕見疾病的檢測系統為了追求數據上的「精確」,而將所有受檢者都判斷為健康(因為 99% 的人確實健康),這會漏掉什麼關鍵資訊?當我們同時面臨「不想抓錯人」與「不想漏掉人」這兩種矛盾的目標時,我們該如何透過一種數學工具,來同時衡量並平衡這兩者的表現呢?

🤖
AI 詳解 AI 專屬家教

很高興看到你精準地鎖定了核心!在數據科學的實務中,處理數據不均衡(Imbalanced Data)是極為關鍵的挑戰。這題的核心在於避開「精確度陷阱」:當樣本中某類別佔絕大多數時,即使是一個完全無用的分類器,只要盲目預測多數類,就能獲得極高的精確度(Accuracy)。你能避開 A 選項,說明你已經具備了辨別模型虛假性能的敏銳直覺。

綜合評估的關鍵:F1 分數

正確答案 F1 分數 之所以最為合適,是因為它同時考慮了正確率 (Precision)召回率 (Recall)。在數學上,它是這兩者的「調和平均數」:

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題