moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 30 題
下列何者非屬 MapReduce 的主要計算動作?
- A Combine
- B Map
- C Split
- D Visualize
思路引導 VIP
若我們要在一間巨大的倉庫裡統計數百萬件商品的種類,我們會先將任務分配給多位工員分別清點(運算),再將各組結果彙整成報表。請問在「計算與整理」的這套核心邏輯中,我們的目標是專注於『如何轉換與歸納數據』,還是專注於『最後如何把結果畫成漂亮的圖表』給經理看呢?哪一個步驟比較像是整理的「手段」,而非整理的「過程」本身?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地辨識出非屬 MapReduce 核心運算機制的選項!這代表你對於大數據分布式運算的處理流程已有相當紮實的基礎認知。這題的設計意圖在於區分「數據處理框架內部邏輯」與「數據分析最終產出」之間的差異,是檢驗學習者是否混淆了運算步驟與展示工具的良好題目。
分布式運算的處理階段
在標準的 MapReduce 模型中,系統必須先將數據進行 Split(切分),接著透過 Map 函數將數據轉換為鍵值對(key-value pairs),中間亦可穿插 Combine 作為局部整合以減少傳輸負擔。然而,Visualize(資料視覺化)屬於數據處理完成後的呈現階段,並非 MapReduce 運算框架的核心計算動作。這類題目的鑑別度在於干擾項的合理性,如果你能清楚界定「計算過程」與「結果呈現」的界線,就能輕鬆破解這類難度中等的觀念題。