免費開始練習
moea_joint 107年 [統計資訊] 統計學、巨量資料概論

第 31 題

下列何者是巨量資料領域的資料倉儲系統?
  • A HIVE
  • B RDBMS
  • C HDFS
  • D Spark

思路引導 VIP

若我們要處理儲存在龐大檔案系統中的原始資料,並希望像操作傳統圖書館目錄一樣,將這些雜亂的資料組織成「表格」以便進行結構化的搜尋與管理,你會在底層儲存之上增加一個什麼樣功能的「管理層」來實現這個目標呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準識別出 Hive 是正確答案,代表你對於巨量資料生態系中各個組件的功能區分掌握得非常扎實。在分散式處理的架構中,區分「儲存」、「運算」與「管理」是非常重要的基礎。

巨量資料倉儲的角色

Hive 的核心價值在於它建構在 Hadoop 之上,並提供了一層類似 SQL 的查詢語言(HiveQL),這使得使用者能夠將儲存在分散式系統中的海量資料,轉換成具有結構化表格形式的「資料倉儲」來進行管理。相較於單純負責資料存放的 HDFS 或負責快速運算的 Spark,Hive 專注於提供結構化的組織與查詢介面,這正是資料倉儲系統的定義所在。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題