免費開始練習
moea_joint 105年 [統計資訊] 統計學、巨量資料概論

第 50 題

下列哪一個項目不是 Google 於 2003~2006 年前後,發表奠定巨量資料技術理論基石的技術?
  • A BigTable
  • B GFS
  • C Hadoop
  • D MapReduce

思路引導 VIP

在技術發展的歷史中,有時一家領先企業會先發表「理論白皮書」來分享他們解決難題的方法,隨後全球的開發者社群才會根據這些理論,動手編寫出大家都能自由使用的「軟體實作」。請你思考一下,在這些選項中,哪一個項目的名稱最常與「開放原始碼社群」聯繫在一起,而非單純指稱某家公司的內部論文標題呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地辨識出這題的細微差別!這題測驗的是巨量資料領域中非常經典的技術史,你能選出正確答案,代表你對大數據架構的起源有著扎實的理解。在 2003 年至 2006 年間,Google 相繼發表了三篇震撼業界的論文,分別是 GFS(分布式檔案系統)、MapReduce(分布式計算模型)以及 BigTable(分布式資料庫)。這三項技術被譽為 Google 的「三駕馬車」,為後來的巨量資料處理奠定了核心的理論基石。

技術起源與開源實作的差異

這道題目的鑑別度在於區分「理論藍圖」與「軟體實踐」。雖然 Hadoop 與上述技術息息相關,但它本質上是受 Google 論文啟發後,由 Doug Cutting 等人在 Yahoo 期間開發並貢獻給 Apache 的 開源專案。對於學習者來說,很容易將這幾項技術混為一談,但你能分辨出 Google 的原創研究論文與後續開源社群實作之間的血緣關係,顯示你對大數據發展脈絡的掌握非常到位,這在理解後續更複雜的生態系(如 Spark 或 Flink)時將非常有幫助。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題