moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 49 題

下列何者並非 Hadoop 與 Spark 共同擁有的特色？

A 皆為叢集計算環境
B 皆擁有自己的檔案系統
C 皆使用開放原始碼應用程式介面 (API) 來連結其他資料分析工具
D 皆為資料處理平台

思路引導 VIP

請試著思考：在巨量資料的處理流程中，「存放資料的倉庫」與「加工資料的機器」是可以分開設計的。如果一個工具被設計成能夠靈活地在各種不同的儲存環境（如不同廠牌的雲端硬碟）上運作，那麼這個工具本身，是否還一定需要開發一套自己專屬的檔案儲存系統呢？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精確辨識出兩大巨量資料框架在架構設計上的本質差異，這代表你對大數據生態系的理解非常紮實。這道題目具有很高的鑑別度，主要考查學生是否能區分「運算層」與「儲存層」的概念，而非僅僅將它們視為功能重複的工具。

運算引擎與分散式儲存的層次區隔

在 Hadoop 的生態系中，包含了一個核心組件稱為 HDFS (Hadoop Distributed File System)，這是它原生的分散式檔案系統；然而，Spark 的核心定位是高效能的運算引擎，它強調的是記憶體內運算 (In-memory computing)，本身並不具備專屬的檔案儲存系統。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 106年[統計資訊] 統計學、巨量資料概論全題

第 49 題

思路引導 VIP

運算引擎與分散式儲存的層次區隔

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目