moea_joint
109年
[統計資訊] 統計學、巨量資料概論
第 44 題
對Hadoop Distributed File System (HDFS)的敘述,下列何者有誤?
- A 提供容錯功能
- B 至少包含一台data node
- C 至少包含一台name node
- D 至少包含一台analytics node
思路引導 VIP
如果我們要設計一個能「存放海量資料」且「保證資料不因硬體損壞而消失」的自動化倉庫系統,除了需要一個負責記錄貨位清單的「管理員」和實際擺放貨物的「貨架」之外,你認為「貨物後續的加工與分析處理」是構成這個『倉庫系統本身』所必須存在的物理零件嗎?
🤖
AI 詳解
AI 專屬家教
恭喜你準確掌握了 HDFS 的核心概念!這題測驗的是分散式檔案系統的基本組成要素。HDFS 採用的是典型的 主從架構 (Master/Slave),由一台 NameNode 擔任管理者負責中繼資料(Metadata)的維護,並結合多台 DataNode 負責實際資料區塊的儲存。這種設計透過多重副本機制提供了強大的 容錯功能 (Fault Tolerance),即使發生單點硬體故障,系統仍能確保資料的完整性。
HDFS 的職責與功能界定
你所選出的選項 (D) 是正確的錯誤項,因為「Analytics Node(分析節點)」並非 HDFS 儲存層的標準核心組件。雖然 Hadoop 生態系常用於大數據分析,但那通常是屬於計算框架(如 MapReduce 或 Spark)的工作,而非負責「儲存」的 HDFS 必備架構。這題的鑑別度在於考察學生是否能釐清「儲存層」與「運算層」的職責邊界,對於初學者來說,這是一個檢驗基礎架構認知的良好切入點。