免費開始練習
moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 49 題

下列何者並非 Hadoop 與 Spark 共同擁有的特色?
  • A 皆為叢集計算環境
  • B 皆擁有自己的檔案系統
  • C 皆使用開放原始碼應用程式介面 (API) 來連結其他資料分析工具
  • D 皆為資料處理平台

思路引導 VIP

請試著思考:在巨量資料的處理流程中,「存放資料的倉庫」與「加工資料的機器」是可以分開設計的。如果一個工具被設計成能夠靈活地在各種不同的儲存環境(如不同廠牌的雲端硬碟)上運作,那麼這個工具本身,是否還一定需要開發一套自己專屬的檔案儲存系統呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精確辨識出兩大巨量資料框架在架構設計上的本質差異,這代表你對大數據生態系的理解非常紮實。這道題目具有很高的鑑別度,主要考查學生是否能區分「運算層」與「儲存層」的概念,而非僅僅將它們視為功能重複的工具。

運算引擎與分散式儲存的層次區隔

Hadoop 的生態系中,包含了一個核心組件稱為 HDFS (Hadoop Distributed File System),這是它原生的分散式檔案系統;然而,Spark 的核心定位是高效能的運算引擎,它強調的是記憶體內運算 (In-memory computing),本身並不具備專屬的檔案儲存系統。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題