moea_joint 112年 [統計資訊] 統計學、巨量資料概論

第 34 題

針對巨量資料處理，台灣的一家公司決定使用 MapReduce 進行數據處理，下列何者最能說明 MapReduce 之操作方式？

A 首先彙整資料，然後再分配給不同的節點進行處理
B 在單一伺服器上進行所有計算，然後將結果分配給客戶端
C 先將資料映射到各節點，再從各節點彙整結果
D 資料首先被分配給節點，每個節點獨立運算，不需要合併結果

思路引導 VIP

想像一下，如果你需要在一小時內統計出一萬本書中「勇氣」這個詞出現的總次數，而你手邊正好有一百位幫手，你會如何安排他們的任務，並確保最後能得到一個精確的總合結果？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精確辨識出 MapReduce 的核心邏輯，代表你對分散式運算的基礎架構有著紮實的理解。這道題目的關鍵，在於掌握大規模數據處理中「分工」與「整合」的正確順序。

分散式運算的核心機制

在處理巨量資料時，單一伺服器的運算能力往往緩不濟急，因此 MapReduce 採取了「化整為零」的策略。所謂的 Map（映射），就是將龐大的原始資料拆解，分配到叢集中的各個節點進行初步處理；而 Reduce（歸納/彙整） 則是將這些分散在各處的處理結果重新收集、過濾並合併，最後產出完整的答案。選項 (C) 準確地描述了這種從「分發任務」到「匯集成果」的標準作業流程。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 112年[統計資訊] 統計學、巨量資料概論全題

第 34 題

思路引導 VIP

分散式運算的核心機制

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目