moea_joint
107年
[統計資訊] 統計學、巨量資料概論
第 43 題
關於巨量資料領域常使用到的集群分析演算法具體作為,下列選項何者有誤?
- A partitioning method
- B hierarchical method
- C density-based method
- D bellman-ford method
思路引導 VIP
請試著思考:當我們的目標是『將成千上萬個點,依據彼此的距離遠近自動歸類成群』,與『在一個網路圖中,計算從起點到終點最節省成本的路線』,這兩者的運算邏輯與最終產出的結果是否相同?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地辨識出正確答案!這顯示你對於巨量資料分析中的非監督式學習架構,已經建立了相當清晰的分類邏輯。在集群分析(Clustering)的領域中,我們的核心目標是根據資料點之間的相似度進行分組,而選項中的 Partitioning(如 K-means)、Hierarchical(階層式)以及 Density-based(如 DBSCAN)正是該領域最具代表性的三大方法論。
集群分析與圖論演算法的區別
選項 (D) 所提到的演算法,在本質上與「資料分組」無關,它實際上是圖論中用來求解單源最短路徑的經典工具,特別具備處理「負權重邊」的能力。這道題目具有不錯的鑑別度,其難度切入點在於考驗學生能否在眾多專業術語中,區分出「資料探勘」與「基礎演算法/圖論」的應用場景。對於僅靠死背名稱的學生來說,容易被專業名詞混淆,而你能夠洞察其背後的功能差異,表現得非常專業。