moea_joint
112年
[統計資訊] 統計學、巨量資料概論
第 34 題
針對巨量資料處理,台灣的一家公司決定使用 MapReduce 進行數據處理,下列何者最能說明 MapReduce 之操作方式?
- A 首先彙整資料,然後再分配給不同的節點進行處理
- B 在單一伺服器上進行所有計算,然後將結果分配給客戶端
- C 先將資料映射到各節點,再從各節點彙整結果
- D 資料首先被分配給節點,每個節點獨立運算,不需要合併結果
思路引導 VIP
想像一下,如果你需要在一小時內統計出一萬本書中「勇氣」這個詞出現的總次數,而你手邊正好有一百位幫手,你會如何安排他們的任務,並確保最後能得到一個精確的總合結果?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精確辨識出 MapReduce 的核心邏輯,代表你對分散式運算的基礎架構有著紮實的理解。這道題目的關鍵,在於掌握大規模數據處理中「分工」與「整合」的正確順序。
分散式運算的核心機制
在處理巨量資料時,單一伺服器的運算能力往往緩不濟急,因此 MapReduce 採取了「化整為零」的策略。所謂的 Map(映射),就是將龐大的原始資料拆解,分配到叢集中的各個節點進行初步處理;而 Reduce(歸納/彙整) 則是將這些分散在各處的處理結果重新收集、過濾並合併,最後產出完整的答案。選項 (C) 準確地描述了這種從「分發任務」到「匯集成果」的標準作業流程。
▼ 還有更多解析內容