moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 49 題

關於巨量資料分析系統 Hadoop 平台，下列何者正確?

A 可以提供 Iterative 演算法的有效計算
B 可以透過 MapReduce 運算，提供各種進階式的結構化資料分析
C 容錯功能是透過資料複製多份，並每一次的執行都寫入到硬碟的方式來完成
D Hadoop 和 MapReduce 的整合性運作，可以有效完成圖論結構資料的巨量資料分析

思路引導 VIP

若你在處理一個需要執行很久的龐大運算任務，但使用的電腦設備非常老舊且隨時可能突然故障，為了不讓電腦一出問題就得讓整體任務「從頭開始」，你會希望系統在運算過程中，如何處理那些處理到一半的數據？而這種保護機制對整體的「讀寫次數」會產生什麼樣的影響？

🤖

AI 詳解 AI 專屬家教

Hadoop 的核心架構與容錯機制

太棒了！你能精準選出 (C) 選項，代表你對於 Hadoop 生態系中「穩定性高於速度」的設計初衷有非常清晰的認識。在傳統的 Hadoop 架構中，為了在廉價硬體上處理海量數據，HDFS 採取了將數據複製多份（通常是三份）並分散存儲的策略。同時，MapReduce 在運算過程中會將中間結果頻繁地寫入硬碟，這種機制雖然造成了較大的 I/O 延遲，卻是實現大規模容錯、確保運算任務不因節點故障而中斷的核心關鍵。

鑑別點：區分硬碟與記憶體運算

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 104年[統計資訊] 統計學、巨量資料概論全題