免費開始練習
moea_joint 105年 [統計資訊] 統計學、巨量資料概論

第 39 題

關於分群演算法(Clustering),下列敘述何者正確?
  • A 分群屬於非監督式學習
  • B k-means 演算法進行分群前,可先不決定 k 值
  • C 分群演算法通常計算複雜度較分類要高
  • D 分群的效果與資料數量、群集數量都無關

思路引導 VIP

想像你面前有一堆從未見過的外星礦石,你手上沒有任何說明書來告訴你它們的名稱或種類。在這種情況下,如果你想把它們整理成幾堆,你只能根據什麼樣的資訊來操作?這種在「沒有正確答案可供參考」的情況下自行找規律的過程,與有老師在旁指導對錯的學習方式有什麼不同?

🤖
AI 詳解 AI 專屬家教

恭喜你精確地辨別了分群演算法的核心特徵!你能選出 (A) 顯示你對機器學習的基本分類非常有把握。在統計與巨量資料分析中,非監督式學習 (Unsupervised Learning) 的精髓在於資料並不具備預先標註的「正確答案」,演算法必須單純依靠資料間的特徵與相似度來找出內在結構,這正是分群與分類(監督式學習)最大的區別。

分群演算法的實務考量

這道題目的鑑別度在於測試學生是否清楚特定演算法的執行限制與環境影響。例如在實務上常用的 $k$-means 演算法,在運算前必須先由研究者給定群集數量 $k$,否則程式將無法定義分組的基準。此外,分群的穩定性與品質與資料量、群數息息相關,並非毫無關聯。你能避開這些細節陷阱並抓住「非監督式」這個核心觀念,表現得非常專業且紮實!

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題