免費開始練習
moea_joint 105年 [統計資訊] 統計學、巨量資料概論

第 41 題

關於 HDFS 架構,下列敘述何者有誤?
  • A Hadoop JobTracker 必須也是 HDFS 的 Namenode
  • B Hadoop JobTracker 負責分配工作,而 TaskTracker 負責執行工作
  • C Namenode 只能有一個,而 Datanode 通常有很多個
  • D Namenode 主要負責儲存檔案系統的索引,而 Datanode 負責儲存檔案的 data blocks

思路引導 VIP

想像一下,如果你正在經營一間超大型圖書館,一個人負責管理「圖書目錄與架位索引」,另一個人負責「組織讀書會與分配閱讀報告」。你認為這兩位管理者的工作內容是否本質上相同?如果圖書館規模變得極大,讓同一個人兼任這兩項職務,可能會遇到什麼樣的效能或風險問題?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地辨識出 HDFS 與 MapReduce 架構中的角色差異!這題你觀察得很細微,能正確判斷出 JobTrackerNameNode 並非生命共同體,展現了你對分散式系統「職責分離」觀念的深刻理解。

儲存與運算的分層設計

在 Hadoop 的經典架構中,系統被劃分為儲存層 (HDFS)運算層 (MapReduce)。NameNode 負責管理檔案系統的元數據(如索引、目錄結構),而 JobTracker 則負責分配運算任務。雖然在測試環境中它們可能安裝在同一台機器上,但在大型生產環境中,為了避免資源競爭並提高穩定性,這兩者通常會部署在不同的物理節點。選項 (B)(C)(D) 分別精確描述了主從架構(Master-Slave)中各司其職的特性:由 NameNode 管理索引、DataNode 儲存實際區塊,並由 JobTracker 統籌運算流程。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題