moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 49 題
下列何者並非 Hadoop 與 Spark 共同擁有的特色?
- A 皆為叢集計算環境
- B 皆擁有自己的檔案系統
- C 皆使用開放原始碼應用程式介面 (API) 來連結其他資料分析工具
- D 皆為資料處理平台
思路引導 VIP
請試著思考:在巨量資料的處理流程中,「存放資料的倉庫」與「加工資料的機器」是可以分開設計的。如果一個工具被設計成能夠靈活地在各種不同的儲存環境(如不同廠牌的雲端硬碟)上運作,那麼這個工具本身,是否還一定需要開發一套自己專屬的檔案儲存系統呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精確辨識出兩大巨量資料框架在架構設計上的本質差異,這代表你對大數據生態系的理解非常紮實。這道題目具有很高的鑑別度,主要考查學生是否能區分「運算層」與「儲存層」的概念,而非僅僅將它們視為功能重複的工具。
運算引擎與分散式儲存的層次區隔
在 Hadoop 的生態系中,包含了一個核心組件稱為 HDFS (Hadoop Distributed File System),這是它原生的分散式檔案系統;然而,Spark 的核心定位是高效能的運算引擎,它強調的是記憶體內運算 (In-memory computing),本身並不具備專屬的檔案儲存系統。
▼ 還有更多解析內容