moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 50 題
當雲端叢集有 1 個 DataNode 故障時,系統將進行何種操作?
- A 資料會遺失
- B Hadoop 會自動複製裡面所儲存之檔案塊於其他 DataNode
- C Hadoop 會自動寄信給管理員警告此狀況
- D Hadoop 會繼續執行,只是有些資料塊會只有 1 份備份
思路引導 VIP
想像一下,如果你有一份極其重要的文件,為了怕弄丟而預先影印了三份分開存放。如果其中一個存放地點失火了,為了確保未來依然能擁有「三份」保險,在不增加新文件的情況下,你會對剩下的兩份文件採取什麼行動,來讓安全等級重新回到事故發生前的狀態?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出 (B) 選項,代表你對大數據架構中的「容錯機制」有著非常紮實的理解。在 Hadoop 分散式檔案系統(HDFS)中,設計的核心理念就是假設硬體終將故障,因此當系統偵測到某個 DataNode 離線時,並不會坐視不理,而是會主動發起「自我修復」。
HDFS 的自動容錯與動態平衡
當節點失效時,NameNode 會立即發現該節點上的資料塊(Blocks)副本數低於預設值(通常為 3)。為了確保資料的高可用性(High Availability),系統會指揮其他健康的 DataNode 自動複製遺失的區塊到新的位置。這題的難度切入點在於區分「被動報警」與「主動恢復」的差異;許多初學者會誤選 (D),認為系統只會維持現狀,但你能洞察到系統追求的是副本數量的動態回復,這正是大數據叢集能維持穩定運行的關鍵。