免費開始練習
moea_joint_essay 106年 [資訊] 資訊管理、程式設計

第 一 題

📖 題組:
請就「巨量資料(Big Data)」回答下列問題:(15 分) (一)請簡述其 4V 特性為何?(6 分) (二)何為 Hadoop 架構(3 分)?其主要的核心包含 Hadoop 分散式檔案系統(Hadoop distributed file system, HDFS)與 Hadoop MapReduce,請簡述此兩者的功能(6 分)。
📝 此題為申論題,共 2 小題

小題 (一)

請簡述其 4V 特性為何?(6 分)

思路引導 VIP

列出並解釋巨量資料的 4V 特性:Volume, Velocity, Variety, Veracity。

🤖
AI 詳解
AI 專屬家教

巨量資料的 4V 特性為:

  1. Volume (資料量):資料的規模龐大,通常達到 TB(Terabytes)、PB(Petabytes)甚至更高層級。
  2. Velocity (資料產生的速度):資料產生、處理及分析的速度極快,有時需要即時(Real-time)處理。

小題 (二)

何為 Hadoop 架構(3 分)?其主要的核心包含 Hadoop 分散式檔案系統(Hadoop distributed file system, HDFS)與 Hadoop MapReduce,請簡述此兩者的功能(6 分)。

思路引導 VIP

說明 Hadoop 架構的概念,並分別解釋 HDFS 和 MapReduce 的功能。

🤖
AI 詳解
AI 專屬家教

Hadoop 架構是一個開源軟體框架,主要用於在分散式的運算環境中,處理和儲存龐大的資料集。其設計目標是利用叢集(Cluster)的強大運算能力,提供高容錯性與高可用性。

  • HDFS (Hadoop 分散式檔案系統):負責資料的儲存。它將大型檔案分割成多個區塊(Blocks),並分散儲存於叢集內的不同節點上。透過資料複製(Replication)機制,確保即使部分節點故障,資料也不會遺失,提供高容錯性。
  • MapReduce:負責資料的處理。它是一種程式設計模型,將任務分為「Map(對應)」和「Reduce(化簡)」兩個階段。Map 階段將工作分派給各節點平行處理;Reduce 階段則將各節點的處理結果進行彙總,最終產生分析結果。

🏷️ 相關主題

物件導向程式設計與系統分析核心概念
查看更多「[資訊] 資訊管理、程式設計」的主題分類考古題