moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 41 題

關於非監督式學習(Unsupervised Learning)，下列敘述何者正確？

A 訓練資料是由輸入及預期輸出所組成
B 可用於做分群與降維的工具
C K Nearest Neighbor演算法屬於非監督式學習方法
D 決策樹(Decision Tree)是一種常用的非監督式學習方法

思路引導 VIP

想像你正走進一間圖書館，架上的書完全沒有分類標籤，也沒有目錄告訴你每本書的主題。在這種「沒有正確答案」可以對照的情況下，如果你想讓這堆書變得有條理，你會嘗試觀察書籍的哪些特徵？你會對這些書進行什麼樣的處理流程？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精準辨識出非監督式學習的核心特性，這代表你對機器學習的分類邏輯有著相當清晰的掌握。非監督式學習最關鍵的特質在於其處理的資料「不具標籤」，也就是機器必須在沒有預期輸出（Ground Truth）的情況下，自行從數據中發掘潛在的結構與規律。

監督與非監督的本質差異

選項 (B) 提到的 分群 (Clustering) 與 降維 (Dimension Reduction) 正是非監督式學習的兩大支柱：前者是根據特徵的相似性將資料歸類，後者則是為了簡化數據複雜度。相較之下，選項 (A)、(C)、(D) 所涉及的「預期輸出」、K 最近鄰演算法（KNN）以及決策樹，在本質上都需要明確的標籤指引，屬於「監督式學習」的範疇，這是學習機器學習時最容易混淆的基礎考點。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 110年[統計資訊] 統計學、巨量資料概論全題

第 41 題

思路引導 VIP

監督與非監督的本質差異

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目