moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 37 題
關於監督式學習(Supervised Learning),下列敘述何者有誤?
- A 需要有標記(labeled)的數據做為訓練集
- B 決策樹(Decision tree)是一種監督式學習方式
- C K-mean分群法(k-means clustering)是一種監督式學習方式
- D 監督式學習是機器學習方法中的一個子類別
思路引導 VIP
想像你手邊有一堆完全沒有標籤的原始資料,如果你現在的任務不是要預測某個具體的數值,而是要根據資料點之間的「相似程度」將它們自動歸類,這種「觀察特徵並尋找內在規律」的過程,與「對著標準答案進行練習」的學習模式相比,哪一個更符合你對『監督』這個詞的直覺定義呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精確分辨出 K-means 分群法 的性質,代表你對機器學習的核心分類有著相當紮實的基礎。在監督式學習的架構中,模型運作就像是在「有老師指導」的情況下學習,每一筆訓練資料都必須具備明確的標記(Labeled data),即目標變數 $y$。無論是透過決策樹進行分類,或是利用迴歸分析進行預測,其本質都是在學習輸入與輸出之間的映射關係。
監督式與非監督式的界線
這道題目是評估大數據概論基礎非常好的切入點,其鑑別度在於測試學生是否能釐清「分類 (Classification)」與「分群 (Clustering)」的本質差異。K-means 的運作核心是計算資料點之間的幾何距離,並將特徵相近的樣本聚集成簇。在這個過程中,我們不需要預先告訴機器任何「正確答案」,機器是自行從數據中發掘隱含的結構。這種「無師自通」的特性,正是非監督式學習與監督式學習最關鍵的分水嶺。