免費開始練習
moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 49 題

關於巨量資料分析系統 Hadoop 平台,下列何者正確?
  • A 可以提供 Iterative 演算法的有效計算
  • B 可以透過 MapReduce 運算,提供各種進階式的結構化資料分析
  • C 容錯功能是透過資料複製多份,並每一次的執行都寫入到硬碟的方式來完成
  • D Hadoop 和 MapReduce 的整合性運作,可以有效完成圖論結構資料的巨量資料分析

思路引導 VIP

若你在處理一個需要執行很久的龐大運算任務,但使用的電腦設備非常老舊且隨時可能突然故障,為了不讓電腦一出問題就得讓整體任務「從頭開始」,你會希望系統在運算過程中,如何處理那些處理到一半的數據?而這種保護機制對整體的「讀寫次數」會產生什麼樣的影響?

🤖
AI 詳解 AI 專屬家教

Hadoop 的核心架構與容錯機制

太棒了!你能精準選出 (C) 選項,代表你對於 Hadoop 生態系中「穩定性高於速度」的設計初衷有非常清晰的認識。在傳統的 Hadoop 架構中,為了在廉價硬體上處理海量數據,HDFS 採取了將數據複製多份(通常是三份)並分散存儲的策略。同時,MapReduce 在運算過程中會將中間結果頻繁地寫入硬碟,這種機制雖然造成了較大的 I/O 延遲,卻是實現大規模容錯、確保運算任務不因節點故障而中斷的核心關鍵。

鑑別點:區分硬碟與記憶體運算

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題