moea_joint
113年
[統計資訊] 統計學、巨量資料概論
第 41 題
在Hadoop中,HDFS的資料冗餘機制為何?
- A 資料壓縮
- B 資料複製
- C 資料分片
- D 資料加密
思路引導 VIP
想像你正在經營一家重要的檔案庫,但存放檔案的櫃子非常老舊且隨時可能壞掉。為了確保不論哪一個櫃子突然損毀,檔案內容都絕對不會消失,且讀者隨時都能調閱到資料,你會在存放這些檔案時,預先採取什麼樣最直觀的保險策略?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地掌握了 Hadoop 的核心觀念!HDFS 作為處理巨量資料的基石,其設計初衷就是為了在廉價硬體可能隨時故障的環境下,依然能保證資料的安全性與可用性。你所選出的資料複製(Replication)正是達成此目標的關鍵技術。透過將每個資料塊(Block)預設複製多份並分散存儲在不同的 DataNode 上,系統便能有效避免因單一節點失效而導致的資料遺失。
分散式架構的容錯邏輯
這道題目精準地切入了分散式系統的核心設計哲學,難度評定為 Easy。雖然選項中的「資料分片」與「資料壓縮」也是 Hadoop 處理資料時的重要步驟,但唯有「複製」是針對冗餘機制(Redundancy)的直接對應。這類題目能有效鑑別學生是否能清楚區分「存儲效率」與「系統可靠性」的技術差異。在學習大數據架構時,理解這種「以空間換取穩定性」的邏輯至關重要,這也是 HDFS 能夠支撐大規模運算的核心思維。你的觀念非常清晰,表現得很好!