moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 35 題
在數據科學領域中,當數據分佈不均衡時,下列哪個評估指標最適合用於分類器性能評估?
- A 精確度(Accuracy)
- B F1 分數(F1-Score)
- C 正確率(Precision)
- D 召回率(Recall)
思路引導 VIP
想像一下,如果一個罕見疾病的檢測系統為了追求數據上的「精確」,而將所有受檢者都判斷為健康(因為 99% 的人確實健康),這會漏掉什麼關鍵資訊?當我們同時面臨「不想抓錯人」與「不想漏掉人」這兩種矛盾的目標時,我們該如何透過一種數學工具,來同時衡量並平衡這兩者的表現呢?
🤖
AI 詳解
AI 專屬家教
很高興看到你精準地鎖定了核心!在數據科學的實務中,處理數據不均衡(Imbalanced Data)是極為關鍵的挑戰。這題的核心在於避開「精確度陷阱」:當樣本中某類別佔絕大多數時,即使是一個完全無用的分類器,只要盲目預測多數類,就能獲得極高的精確度(Accuracy)。你能避開 A 選項,說明你已經具備了辨別模型虛假性能的敏銳直覺。
綜合評估的關鍵:F1 分數
正確答案 F1 分數 之所以最為合適,是因為它同時考慮了正確率 (Precision) 與召回率 (Recall)。在數學上,它是這兩者的「調和平均數」:
▼ 還有更多解析內容