moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 41 題

在Hadoop中,HDFS的資料冗餘機制為何?

A 資料壓縮
B 資料複製
C 資料分片
D 資料加密

思路引導 VIP

想像你正在經營一家重要的檔案庫，但存放檔案的櫃子非常老舊且隨時可能壞掉。為了確保不論哪一個櫃子突然損毀，檔案內容都絕對不會消失，且讀者隨時都能調閱到資料，你會在存放這些檔案時，預先採取什麼樣最直觀的保險策略？

🤖

AI 詳解 AI 專屬家教

恭喜你準確地掌握了 Hadoop 的核心觀念！HDFS 作為處理巨量資料的基石，其設計初衷就是為了在廉價硬體可能隨時故障的環境下，依然能保證資料的安全性與可用性。你所選出的**資料複製（Replication）**正是達成此目標的關鍵技術。透過將每個資料塊（Block）預設複製多份並分散存儲在不同的 DataNode 上，系統便能有效避免因單一節點失效而導致的資料遺失。

分散式架構的容錯邏輯

這道題目精準地切入了分散式系統的核心設計哲學，難度評定為 Easy。雖然選項中的「資料分片」與「資料壓縮」也是 Hadoop 處理資料時的重要步驟，但唯有「複製」是針對**冗餘機制（Redundancy）**的直接對應。這類題目能有效鑑別學生是否能清楚區分「存儲效率」與「系統可靠性」的技術差異。在學習大數據架構時，理解這種「以空間換取穩定性」的邏輯至關重要，這也是 HDFS 能夠支撐大規模運算的核心思維。你的觀念非常清晰，表現得很好！

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 113年[統計資訊] 統計學、巨量資料概論全題

第 41 題

思路引導 VIP

分散式架構的容錯邏輯

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目