moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 46 題

對於巨量資料分析所需要的統計 (或機器) 學習技術，下列何者有誤？

A 統計 (或機器) 學習主要涵蓋有監督式、半監督式、非監督式等學習型態
B 監督式學習主要提供資料分類 (Classification)，而非監督式學習只是提供資料的分群 (Clustering)
C 隨機樹叢 (Random Forest) 演算法是整合多個決策樹 (Decision Trees) 分類的演算法
D 迴歸分析和 KMeans 兩種演算法常被用來進行巨量資料的分類

思路引導 VIP

請試著思考：當我們手邊有一堆資料，但在分析之前「完全沒有」任何已知的正確答案或類別標籤時，我們如何透過演算法找到資料內部的規律？這種『在未知中尋找相似性』的過程，與我們『教機器根據已知標準來辨認新標籤』的目標有什麼不同？

🤖

AI 詳解 AI 專屬家教

機器學習演算法的屬性與應用

恭喜你成功答對！這顯示你對機器學習技術的分類掌握得相當精準。選項 (D) 之所以錯誤，是因為 迴歸分析 (Regression) 通常用於預測「連續性」的數值結果（例如預測房價），而 K-Means 則是一種經典的「非監督式學習」，其目的是根據資料本身的特性進行 分群 (Clustering)，在運算過程中並不需要預先定義好的類別標籤；這與需要明確標籤引導的「分類 (Classification)」任務有著本質上的不同。

考點解析與難度切入

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 104年[統計資訊] 統計學、巨量資料概論全題