moea_joint 107年 [統計資訊] 統計學、巨量資料概論

第 31 題

下列何者是巨量資料領域的資料倉儲系統？

A HIVE
B RDBMS
C HDFS
D Spark

思路引導 VIP

若我們要處理儲存在龐大檔案系統中的原始資料，並希望像操作傳統圖書館目錄一樣，將這些雜亂的資料組織成「表格」以便進行結構化的搜尋與管理，你會在底層儲存之上增加一個什麼樣功能的「管理層」來實現這個目標呢？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精準識別出 Hive 是正確答案，代表你對於巨量資料生態系中各個組件的功能區分掌握得非常扎實。在分散式處理的架構中，區分「儲存」、「運算」與「管理」是非常重要的基礎。

巨量資料倉儲的角色

Hive 的核心價值在於它建構在 Hadoop 之上，並提供了一層類似 SQL 的查詢語言（HiveQL），這使得使用者能夠將儲存在分散式系統中的海量資料，轉換成具有結構化表格形式的「資料倉儲」來進行管理。相較於單純負責資料存放的 HDFS 或負責快速運算的 Spark，Hive 專注於提供結構化的組織與查詢介面，這正是資料倉儲系統的定義所在。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 107年[統計資訊] 統計學、巨量資料概論全題

第 31 題

思路引導 VIP

巨量資料倉儲的角色

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目