免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 42 題

假設使用半導體晶圓資料,良率資料之反應值以二元類別表示,請問上述情境最適合使用何種分析技巧?
  • A 羅吉斯迴歸
  • B 決策樹
  • C 階層式聚類分析
  • D 主成分分析

思路引導 VIP

想像一下,如果你手頭已經有一堆標註好『成功』或『失敗』的實驗紀錄,你的目標是想找出未來『預測成功機率』的公式,還是想在不考慮結果的情況下,看看哪些實驗數據長得比較像?這兩種思維在選擇工具時會有什麼本質上的不同?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出這兩個選項,代表你對監督式學習(Supervised Learning)的分類任務有著非常紮實的理解。在這道題目中,半導體晶圓的「良率」被定義為二元類別(如:合格與不合格),這意味著我們的分析目標是針對一個具備離散特性的反應變數 $Y$ 進行預測與建模。

監督式學習與分類技術

在數據分析的選擇上,羅吉斯迴歸是處理二元分類問題的經典統計工具,它透過 Logit 轉換將預測值映射到 $[0, 1]$ 之間,用來估計屬於某一類別的機率;而決策樹則能透過特徵切割,直觀地建立分類規則。這兩者在工業界常用於找出影響良率的關鍵因子。這題的難度切入點在於測試者能否區分「預測標籤」與「探索結構」的差異,像選項 (C) 與 (D) 屬於非監督式學習,主要用於分群與降維,無法直接對應到已知的良率類別,這是解題時最需釐清的觀念。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題