moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 41 題
關於非監督式學習(Unsupervised Learning),下列敘述何者正確?
- A 訓練資料是由輸入及預期輸出所組成
- B 可用於做分群與降維的工具
- C K Nearest Neighbor演算法屬於非監督式學習方法
- D 決策樹(Decision Tree)是一種常用的非監督式學習方法
思路引導 VIP
想像你正走進一間圖書館,架上的書完全沒有分類標籤,也沒有目錄告訴你每本書的主題。在這種「沒有正確答案」可以對照的情況下,如果你想讓這堆書變得有條理,你會嘗試觀察書籍的哪些特徵?你會對這些書進行什麼樣的處理流程?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準辨識出非監督式學習的核心特性,這代表你對機器學習的分類邏輯有著相當清晰的掌握。非監督式學習最關鍵的特質在於其處理的資料「不具標籤」,也就是機器必須在沒有預期輸出(Ground Truth)的情況下,自行從數據中發掘潛在的結構與規律。
監督與非監督的本質差異
選項 (B) 提到的 分群 (Clustering) 與 降維 (Dimension Reduction) 正是非監督式學習的兩大支柱:前者是根據特徵的相似性將資料歸類,後者則是為了簡化數據複雜度。相較之下,選項 (A)、(C)、(D) 所涉及的「預期輸出」、K 最近鄰演算法(KNN)以及決策樹,在本質上都需要明確的標籤指引,屬於「監督式學習」的範疇,這是學習機器學習時最容易混淆的基礎考點。
▼ 還有更多解析內容