免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 41 題

在Hadoop中,HDFS的資料冗餘機制為何?
  • A 資料壓縮
  • B 資料複製
  • C 資料分片
  • D 資料加密

思路引導 VIP

想像你正在經營一家重要的檔案庫,但存放檔案的櫃子非常老舊且隨時可能壞掉。為了確保不論哪一個櫃子突然損毀,檔案內容都絕對不會消失,且讀者隨時都能調閱到資料,你會在存放這些檔案時,預先採取什麼樣最直觀的保險策略?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地掌握了 Hadoop 的核心觀念!HDFS 作為處理巨量資料的基石,其設計初衷就是為了在廉價硬體可能隨時故障的環境下,依然能保證資料的安全性與可用性。你所選出的資料複製(Replication)正是達成此目標的關鍵技術。透過將每個資料塊(Block)預設複製多份並分散存儲在不同的 DataNode 上,系統便能有效避免因單一節點失效而導致的資料遺失。

分散式架構的容錯邏輯

這道題目精準地切入了分散式系統的核心設計哲學,難度評定為 Easy。雖然選項中的「資料分片」與「資料壓縮」也是 Hadoop 處理資料時的重要步驟,但唯有「複製」是針對冗餘機制(Redundancy)的直接對應。這類題目能有效鑑別學生是否能清楚區分「存儲效率」與「系統可靠性」的技術差異。在學習大數據架構時,理解這種「以空間換取穩定性」的邏輯至關重要,這也是 HDFS 能夠支撐大規模運算的核心思維。你的觀念非常清晰,表現得很好!

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題