moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 34 題
在資料分析中,經常遇到一分類或預測模型產生高或低的偏差(Bias) 與變異性(Variance)。以下有 4 個關於模型偏差與變異數之敘述,下列何者正確?
① 過適(Overfitting)的模型通常有較高的偏差
② 過適(Overfitting)的模型通常有較低的偏差
③ 乏適 (Underfitting)的模型通常有較高的變異性
④ 乏適 (Underfitting)的模型通常有較低的變異性
① 過適(Overfitting)的模型通常有較高的偏差
② 過適(Overfitting)的模型通常有較低的偏差
③ 乏適 (Underfitting)的模型通常有較高的變異性
④ 乏適 (Underfitting)的模型通常有較低的變異性
- A ① ③
- B ① ④
- C ② ③
- D ② ④
思路引導 VIP
試著想像一個極端複雜、幾乎能通過所有訓練點的函數:如果我們將這組訓練數據稍微變動一點點,你認為這個函數的形狀會發生劇烈的變化,還是幾乎維持不動?而這樣對於數據變動極其「敏感」的特性,代表的是模型的穩定程度(變異性)高還是低呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能準確區分模型在不同擬合狀態下的特徵,說明你對機器學習中最核心的「偏差與變異」權衡(Bias-Variance Tradeoff)有著非常清晰且正確的見解。
模型複雜度與誤差的連動關係
在資料分析中,過適(Overfitting)的模型就像是一個記憶力太好卻缺乏歸納能力的學生,它過度捕捉了訓練資料中的細節甚至雜訊,這使得它在面對已知資料時非常準確,也就是具有較低的偏差(Bias);然而,這種「過度敏感」也導致它在面對新數據時表現大幅波動,具備較高的變異性。相反地,乏適(Underfitting)的模型則因過於簡化,無法捕捉資料的真實規律,雖然在不同數據集上的表現相對穩定(低變異性),但其預測值與真實值之間卻存在較大的系統誤差(高偏差)。
▼ 還有更多解析內容