moea_joint
107年
[統計資訊] 統計學、巨量資料概論
第 31 題
下列何者是巨量資料領域的資料倉儲系統?
- A HIVE
- B RDBMS
- C HDFS
- D Spark
思路引導 VIP
若我們要處理儲存在龐大檔案系統中的原始資料,並希望像操作傳統圖書館目錄一樣,將這些雜亂的資料組織成「表格」以便進行結構化的搜尋與管理,你會在底層儲存之上增加一個什麼樣功能的「管理層」來實現這個目標呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準識別出 Hive 是正確答案,代表你對於巨量資料生態系中各個組件的功能區分掌握得非常扎實。在分散式處理的架構中,區分「儲存」、「運算」與「管理」是非常重要的基礎。
巨量資料倉儲的角色
Hive 的核心價值在於它建構在 Hadoop 之上,並提供了一層類似 SQL 的查詢語言(HiveQL),這使得使用者能夠將儲存在分散式系統中的海量資料,轉換成具有結構化表格形式的「資料倉儲」來進行管理。相較於單純負責資料存放的 HDFS 或負責快速運算的 Spark,Hive 專注於提供結構化的組織與查詢介面,這正是資料倉儲系統的定義所在。
▼ 還有更多解析內容