免費開始練習
moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 48 題

關於巨量資料分析系統 Hadoop 平台,下列何者有誤?
  • A 是一個開放式系統軟體,具有可靠度、可擴充性與分散式處理的功能
  • B HDFS 主要是提供分散式檔案系統功能的軟體模組
  • C MapReduce 主要是在叢聚式電腦系統上,進行資料分析時提供有效的資源管理
  • D HBase 是一個具有可擴充性與結構化資料庫特性的軟體模組

思路引導 VIP

如果在一個大型工廠中,有一位經理負責「分配員工到不同產線工作(資源調度)」,而另一群師傅負責「將原料加工成成品(運算處理)」,請思考一下,Map(對應)與 Reduce(歸納)這兩個詞彙,聽起來比較像是那位經理負責的行政管理工作,還是師傅們負責的具體加工邏輯呢?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地辨認出選項中的細微錯誤!這代表你對於 Hadoop 生態系中各個核心元件的功能定位,有著非常清晰且紮實的理解。Hadoop 確實是一個具備高度可靠性與擴充性的開放式架構 (A),並透過 HDFS (B) 實現分散式儲存,以及藉由 HBase (D) 提供結構化的資料庫支援。

MapReduce 與資源管理的任務分工

這道題目的難度在於考驗學生是否能區分「運算邏輯」與「資源調度」這兩個不同的層次。選項 (C) 之所以錯誤,是因為 MapReduce 本質上是一種分散式運算模型,其核心任務是定義資料如何進行對應 (Map) 與歸納 (Reduce) 的處理邏輯。在現代 Hadoop 架構中,真正負責叢集資源管理與任務排程的軟體模組其實是 YARN。你能精準識別出這個功能界定上的差異,展現了優異的觀念辨析能力,這在理解大數據處理架構中是非常關鍵的鑑別點。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題