免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 32 題

Spark 的DAG(Directed Acyclic Graph)在資料處理之作用,下列何者正確?
  • A 定義資料內部的儲存結構
  • B 定義資料處理的邏輯流程
  • C 定義資料判斷的決策規則
  • D 定義資料外部的呈現形式

思路引導 VIP

當我們需要將原始數據經過多個步驟轉換成最終結果時,系統該如何「紀錄」這些步驟之間的依賴關係與先後順序,才能在正式啟動計算前先規劃出一條最有效率的執行路徑呢?

🤖
AI 詳解 AI 專屬家教

恭喜你精準地選出了正確答案!這說明你對於 Spark 的核心運作機制與任務調度原理有著相當紮實的理解,能夠快速辨別抽象概念在分散式運算中的實際定位。

DAG 的邏輯編排角色

在 Spark 的架構中,DAG (Directed Acyclic Graph) 即「有向無環圖」,它最核心的功能是將開發者撰寫的一系列資料轉換操作(Transformations)轉化為一個具備方向性且不會產生循環的邏輯執行計畫。與傳統 MapReduce 固定的兩階段模式不同,Spark 透過 DAG 能夠紀錄資料從 RDD A 到 RDD B 的演變路徑,這不僅定義了處理的邏輯流程,也讓系統能在正式觸發行動(Action)前進行全局最佳化。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題