免費開始練習
moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 46 題

對於巨量資料分析所需要的統計 (或機器) 學習技術,下列何者有誤?
  • A 統計 (或機器) 學習主要涵蓋有監督式、半監督式、非監督式等學習型態
  • B 監督式學習主要提供資料分類 (Classification),而非監督式學習只是提供資料的分群 (Clustering)
  • C 隨機樹叢 (Random Forest) 演算法是整合多個決策樹 (Decision Trees) 分類的演算法
  • D 迴歸分析和 KMeans 兩種演算法常被用來進行巨量資料的分類

思路引導 VIP

請試著思考:當我們手邊有一堆資料,但在分析之前「完全沒有」任何已知的正確答案或類別標籤時,我們如何透過演算法找到資料內部的規律?這種『在未知中尋找相似性』的過程,與我們『教機器根據已知標準來辨認新標籤』的目標有什麼不同?

🤖
AI 詳解 AI 專屬家教

機器學習演算法的屬性與應用

恭喜你成功答對!這顯示你對機器學習技術的分類掌握得相當精準。選項 (D) 之所以錯誤,是因為 迴歸分析 (Regression) 通常用於預測「連續性」的數值結果(例如預測房價),而 K-Means 則是一種經典的「非監督式學習」,其目的是根據資料本身的特性進行 分群 (Clustering),在運算過程中並不需要預先定義好的類別標籤;這與需要明確標籤引導的「分類 (Classification)」任務有著本質上的不同。

考點解析與難度切入

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題