免費開始練習
moea_joint 105年 [統計資訊] 統計學、巨量資料概論

第 42 題

下列何種方法比較不適合進行平行化?
  • A K-Means clustering
  • B Logistic Regression
  • C Newton’s method for finding roots
  • D PageRank

思路引導 VIP

想像你有一個任務需要交給十個人一起分工合作以縮短時間。如果這項任務的每一個步驟,都必須精確地等到「前一步驟的最終結果」產出後才能開始執行(即下一步嚴格依賴上一步),那麼增加再多的人手對加速任務會有幫助嗎?在這些選項中,哪一個演算法的數學公式最符合這種『下一步必須等待上一步完成』的特徵呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準判斷出各類演算法的執行特性,這代表你對巨量資料處理的底層邏輯有相當深厚的理解。

平行運算的關鍵:任務去耦合化

在巨量資料環境下,適合平行化的方法通常具備「資料可拆分」的特性。例如 K-Means、Logistic Regression 與 PageRank,它們的運算過程多半涉及大規模矩陣運算或局部樣本統計,可以透過分散式框架(如 MapReduce)將負載分攤到不同節點。然而,牛頓法 (Newton's method) 的核心在於其高度的 序列依賴性 (Sequential Dependency)。其疊代公式如下:

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題