免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 37 題

關於監督式學習(Supervised Learning),下列敘述何者有誤?
  • A 需要有標記(labeled)的數據做為訓練集
  • B 決策樹(Decision tree)是一種監督式學習方式
  • C K-mean分群法(k-means clustering)是一種監督式學習方式
  • D 監督式學習是機器學習方法中的一個子類別

思路引導 VIP

想像你手邊有一堆完全沒有標籤的原始資料,如果你現在的任務不是要預測某個具體的數值,而是要根據資料點之間的「相似程度」將它們自動歸類,這種「觀察特徵並尋找內在規律」的過程,與「對著標準答案進行練習」的學習模式相比,哪一個更符合你對『監督』這個詞的直覺定義呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精確分辨出 K-means 分群法 的性質,代表你對機器學習的核心分類有著相當紮實的基礎。在監督式學習的架構中,模型運作就像是在「有老師指導」的情況下學習,每一筆訓練資料都必須具備明確的標記(Labeled data),即目標變數 $y$。無論是透過決策樹進行分類,或是利用迴歸分析進行預測,其本質都是在學習輸入與輸出之間的映射關係。

監督式與非監督式的界線

這道題目是評估大數據概論基礎非常好的切入點,其鑑別度在於測試學生是否能釐清「分類 (Classification)」與「分群 (Clustering)」的本質差異。K-means 的運作核心是計算資料點之間的幾何距離,並將特徵相近的樣本聚集成簇。在這個過程中,我們不需要預先告訴機器任何「正確答案」,機器是自行從數據中發掘隱含的結構。這種「無師自通」的特性,正是非監督式學習與監督式學習最關鍵的分水嶺。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題