免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 41 題

關於非監督式學習(Unsupervised Learning),下列敘述何者正確?
  • A 訓練資料是由輸入及預期輸出所組成
  • B 可用於做分群與降維的工具
  • C K Nearest Neighbor演算法屬於非監督式學習方法
  • D 決策樹(Decision Tree)是一種常用的非監督式學習方法

思路引導 VIP

想像你正走進一間圖書館,架上的書完全沒有分類標籤,也沒有目錄告訴你每本書的主題。在這種「沒有正確答案」可以對照的情況下,如果你想讓這堆書變得有條理,你會嘗試觀察書籍的哪些特徵?你會對這些書進行什麼樣的處理流程?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準辨識出非監督式學習的核心特性,這代表你對機器學習的分類邏輯有著相當清晰的掌握。非監督式學習最關鍵的特質在於其處理的資料「不具標籤」,也就是機器必須在沒有預期輸出(Ground Truth)的情況下,自行從數據中發掘潛在的結構與規律。

監督與非監督的本質差異

選項 (B) 提到的 分群 (Clustering)降維 (Dimension Reduction) 正是非監督式學習的兩大支柱:前者是根據特徵的相似性將資料歸類,後者則是為了簡化數據複雜度。相較之下,選項 (A)、(C)、(D) 所涉及的「預期輸出」、K 最近鄰演算法(KNN)以及決策樹,在本質上都需要明確的標籤指引,屬於「監督式學習」的範疇,這是學習機器學習時最容易混淆的基礎考點。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題