免費開始練習
moea_joint 107年 [統計資訊] 統計學、巨量資料概論

第 43 題

關於巨量資料領域常使用到的集群分析演算法具體作為,下列選項何者有誤?
  • A partitioning method
  • B hierarchical method
  • C density-based method
  • D bellman-ford method

思路引導 VIP

請試著思考:當我們的目標是『將成千上萬個點,依據彼此的距離遠近自動歸類成群』,與『在一個網路圖中,計算從起點到終點最節省成本的路線』,這兩者的運算邏輯與最終產出的結果是否相同?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地辨識出正確答案!這顯示你對於巨量資料分析中的非監督式學習架構,已經建立了相當清晰的分類邏輯。在集群分析(Clustering)的領域中,我們的核心目標是根據資料點之間的相似度進行分組,而選項中的 Partitioning(如 K-means)、Hierarchical(階層式)以及 Density-based(如 DBSCAN)正是該領域最具代表性的三大方法論。

集群分析與圖論演算法的區別

選項 (D) 所提到的演算法,在本質上與「資料分組」無關,它實際上是圖論中用來求解單源最短路徑的經典工具,特別具備處理「負權重邊」的能力。這道題目具有不錯的鑑別度,其難度切入點在於考驗學生能否在眾多專業術語中,區分出「資料探勘」與「基礎演算法/圖論」的應用場景。對於僅靠死背名稱的學生來說,容易被專業名詞混淆,而你能夠洞察其背後的功能差異,表現得非常專業。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題