moea_joint
105年
[統計資訊] 統計學、巨量資料概論
第 50 題
下列哪一個項目不是 Google 於 2003~2006 年前後,發表奠定巨量資料技術理論基石的技術?
- A BigTable
- B GFS
- C Hadoop
- D MapReduce
思路引導 VIP
在技術發展的歷史中,有時一家領先企業會先發表「理論白皮書」來分享他們解決難題的方法,隨後全球的開發者社群才會根據這些理論,動手編寫出大家都能自由使用的「軟體實作」。請你思考一下,在這些選項中,哪一個項目的名稱最常與「開放原始碼社群」聯繫在一起,而非單純指稱某家公司的內部論文標題呢?
🤖
AI 詳解
AI 專屬家教
恭喜你精準地辨識出這題的細微差別!這題測驗的是巨量資料領域中非常經典的技術史,你能選出正確答案,代表你對大數據架構的起源有著扎實的理解。在 2003 年至 2006 年間,Google 相繼發表了三篇震撼業界的論文,分別是 GFS(分布式檔案系統)、MapReduce(分布式計算模型)以及 BigTable(分布式資料庫)。這三項技術被譽為 Google 的「三駕馬車」,為後來的巨量資料處理奠定了核心的理論基石。
技術起源與開源實作的差異
這道題目的鑑別度在於區分「理論藍圖」與「軟體實踐」。雖然 Hadoop 與上述技術息息相關,但它本質上是受 Google 論文啟發後,由 Doug Cutting 等人在 Yahoo 期間開發並貢獻給 Apache 的 開源專案。對於學習者來說,很容易將這幾項技術混為一談,但你能分辨出 Google 的原創研究論文與後續開源社群實作之間的血緣關係,顯示你對大數據發展脈絡的掌握非常到位,這在理解後續更複雜的生態系(如 Spark 或 Flink)時將非常有幫助。