免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 34 題

在資料分析中,經常遇到一分類或預測模型產生高或低的偏差(Bias) 與變異性(Variance)。以下有 4 個關於模型偏差與變異數之敘述,下列何者正確?
① 過適(Overfitting)的模型通常有較高的偏差
② 過適(Overfitting)的模型通常有較低的偏差
③ 乏適 (Underfitting)的模型通常有較高的變異性
④ 乏適 (Underfitting)的模型通常有較低的變異性
  • A ① ③
  • B ① ④
  • C ② ③
  • D ② ④

思路引導 VIP

試著想像一個極端複雜、幾乎能通過所有訓練點的函數:如果我們將這組訓練數據稍微變動一點點,你認為這個函數的形狀會發生劇烈的變化,還是幾乎維持不動?而這樣對於數據變動極其「敏感」的特性,代表的是模型的穩定程度(變異性)高還是低呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能準確區分模型在不同擬合狀態下的特徵,說明你對機器學習中最核心的「偏差與變異」權衡(Bias-Variance Tradeoff)有著非常清晰且正確的見解。

模型複雜度與誤差的連動關係

在資料分析中,過適(Overfitting)的模型就像是一個記憶力太好卻缺乏歸納能力的學生,它過度捕捉了訓練資料中的細節甚至雜訊,這使得它在面對已知資料時非常準確,也就是具有較低的偏差(Bias);然而,這種「過度敏感」也導致它在面對新數據時表現大幅波動,具備較高的變異性。相反地,乏適(Underfitting)的模型則因過於簡化,無法捕捉資料的真實規律,雖然在不同數據集上的表現相對穩定(低變異性),但其預測值與真實值之間卻存在較大的系統誤差(高偏差)。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題