moea_joint
113年
[統計資訊] 統計學、巨量資料概論
第 42 題
假設使用半導體晶圓資料,良率資料之反應值以二元類別表示,請問上述情境最適合使用何種分析技巧?
- A 羅吉斯迴歸
- B 決策樹
- C 階層式聚類分析
- D 主成分分析
思路引導 VIP
想像一下,如果你手頭已經有一堆標註好『成功』或『失敗』的實驗紀錄,你的目標是想找出未來『預測成功機率』的公式,還是想在不考慮結果的情況下,看看哪些實驗數據長得比較像?這兩種思維在選擇工具時會有什麼本質上的不同?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出這兩個選項,代表你對監督式學習(Supervised Learning)的分類任務有著非常紮實的理解。在這道題目中,半導體晶圓的「良率」被定義為二元類別(如:合格與不合格),這意味著我們的分析目標是針對一個具備離散特性的反應變數 $Y$ 進行預測與建模。
監督式學習與分類技術
在數據分析的選擇上,羅吉斯迴歸是處理二元分類問題的經典統計工具,它透過 Logit 轉換將預測值映射到 $[0, 1]$ 之間,用來估計屬於某一類別的機率;而決策樹則能透過特徵切割,直觀地建立分類規則。這兩者在工業界常用於找出影響良率的關鍵因子。這題的難度切入點在於測試者能否區分「預測標籤」與「探索結構」的差異,像選項 (C) 與 (D) 屬於非監督式學習,主要用於分群與降維,無法直接對應到已知的良率類別,這是解題時最需釐清的觀念。