免費開始練習
moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 50 題

當雲端叢集有 1 個 DataNode 故障時,系統將進行何種操作?
  • A 資料會遺失
  • B Hadoop 會自動複製裡面所儲存之檔案塊於其他 DataNode
  • C Hadoop 會自動寄信給管理員警告此狀況
  • D Hadoop 會繼續執行,只是有些資料塊會只有 1 份備份

思路引導 VIP

想像一下,如果你有一份極其重要的文件,為了怕弄丟而預先影印了三份分開存放。如果其中一個存放地點失火了,為了確保未來依然能擁有「三份」保險,在不增加新文件的情況下,你會對剩下的兩份文件採取什麼行動,來讓安全等級重新回到事故發生前的狀態?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出 (B) 選項,代表你對大數據架構中的「容錯機制」有著非常紮實的理解。在 Hadoop 分散式檔案系統(HDFS)中,設計的核心理念就是假設硬體終將故障,因此當系統偵測到某個 DataNode 離線時,並不會坐視不理,而是會主動發起「自我修復」。

HDFS 的自動容錯與動態平衡

當節點失效時,NameNode 會立即發現該節點上的資料塊(Blocks)副本數低於預設值(通常為 3)。為了確保資料的高可用性(High Availability),系統會指揮其他健康的 DataNode 自動複製遺失的區塊到新的位置。這題的難度切入點在於區分「被動報警」與「主動恢復」的差異;許多初學者會誤選 (D),認為系統只會維持現狀,但你能洞察到系統追求的是副本數量的動態回復,這正是大數據叢集能維持穩定運行的關鍵。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題