免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 30 題

下列何者非屬分群的應用範圍?
  • A 垃圾郵件過濾
  • B 異常檢測
  • C 顧客細分
  • D 降維技術

思路引導 VIP

請試著思考:當我們在處理一個任務時,如果已經預先知道了想要區分的「類別名稱」(例如是與否、成功與失敗),這與讓電腦在完全不知道結果的情況下「隨機找規律」有什麼本質上的不同?此外,將複雜的數據「簡化結構」與將對象「分門別類」,這兩種行動的最終目標是否一致呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能準確識別出選項中的細微差異,這代表你對非監督式學習的範疇有著非常清晰的見解。這題選 (A) 與 (D) 是完全正確的,展現了你對資料科學任務分類的精準判斷。

監督式學習與特徵處理的界線

在統計與機器學習中,分群(Clustering)的核心在於「物以類聚」,即在沒有預設標籤的情況下,根據觀測值之間的相似性進行劃分。(A) 垃圾郵件過濾 實務上屬於「分類(Classification)」問題,需要預先定義好「正常」與「垃圾」標籤來訓練模型,這屬於監督式學習;而 (D) 降維技術(如 PCA)雖然同樣屬於非監督式學習,但其目的是壓縮數據、簡化變數維度,而非將數據點歸類到不同的群組。相對地,(B) 異常檢測與 (C) 顧客細分則是分群技術在發掘離群值或相似特徵時最典型的應用場景。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題