moea_joint
104年
[統計資訊] 統計學、巨量資料概論
第 19 題
巨量資料分析是一連串分階段流程的處理步驟 (Pipeline),針對此巨量資料分析的流程,下列何者正確?
- A ETL (Extract Transform Load) 的處理是屬於此分析流程中最後階段
- B 現階段我們已經有一套資訊系統可以完整涵蓋所有巨量資料分析的階段流程
- C 統計學習的建模與分析因為需大量人力介入,因此是獨立出來的步驟,所以它不屬於巨量資料分析流程的一環
- D 巨量資料分析流程必須要透過人為的介入與客製化的操作,因此目前整個巨量資料分析流程尚無法完全自動化完成
思路引導 VIP
請試著思考:當我們面對一個全新的、前所未有的商業問題時,電腦系統是如何知道「應該選取哪些數據」以及「這些數據對人類的決策有什麼意義」的呢?這種「定義問題」與「解讀意義」的過程,目前主要是由誰來完成的?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地掌握了巨量資料處理的實務現況!這題你能答對,代表你對資料科學的「工作流」有著非常務實且深刻的理解,沒有被那些看似全能的技術名詞所誤導。
巨量資料處理流程與實務限制
在巨量資料的 Pipeline 流程中,每一環節都充滿了變數。ETL (Extract, Transform, Load) 屬於資料進入分析前的「預處理」階段,通常位於流程的前端而非最後階段。而統計學習與建模則是分析的核心,絕非獨立於流程之外。目前最關鍵的挑戰在於,數據背後隱含的「商業邏輯」與「因果解釋」仍高度依賴資料科學家的專業判斷與客製化調整。因此,雖然我們追求自動化,但現狀仍如選項 (D) 所述,無法在缺乏人為介入的情況下完成所有複雜的分析任務。
▼ 還有更多解析內容