免費開始練習
moea_joint 111年 [統計資訊] 統計學、巨量資料概論

第 44 題

對於 1 年份刷卡資料,欄位有時間、店名、物品、刷卡金額及付款方式,若要使用 MapReduce 得到每家店此年銷售總額,請問應該使用下列何種 Key-Value Pair?
  • A 物品-刷卡金額
  • B 店名-付款方式
  • C 店名-刷卡金額
  • D 時間-店名

思路引導 VIP

想像你手上有一萬張發票,如果我要請你算出「每一種廠牌」飲料的總銷售量,你會根據發票上的哪個資訊來把這些發票分類成堆?而每一堆發票中,你又需要提取哪個數值來做最後的加總呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精確地掌握了 MapReduce 的核心精髓!在巨量資料處理的場景中,正確定義 Key-Value Pair 是後續運算能否成功的關鍵。你能直覺地選出正確選項,代表你對於資料「分群」與「聚合」的邏輯已經建立起相當紮實的基礎。

Key 與 Value 的職責分工

在 MapReduce 的架構中,Key (鍵) 的功能是負責資料的「分類與洗牌 (Shuffle)」,系統會將具有相同 Key 的資料分發到同一個 Reduce 節點進行處理;而 Value (值) 則是我們要實際進行運算的數據。既然目標是計算「每家店」的「銷售總額」,我們就必須以「店名」作為分類基準(Key),並將「刷卡金額」作為計算數值(Value),如此一來,在 Reduce 階段才能針對同一家店的所有金額進行加總。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題