moea_joint
104年
[統計資訊] 統計學、巨量資料概論
第 16 題
關於巨量資料分析的概念,下列何者正確?
- A 巨量資料分析主要是針對量大的數據分析,因此對於資料來源多樣性和資料產生快慢等因素將不列入考慮
- B 巨量資料分析的資料格式僅限於結構化資料,因此非結構化與半結構化資料不納入其分析的範疇
- C 巨量資料分析的建模是透過由下而上 (Bottom-Up) 的數學歸納推理方式來解讀資料的規則,這和傳統資料庫系統以由上而下 (Top-Down) 的建模方式有所不同
- D 巨量資料分析方法可以利用現有資料庫管理系統技術來完成
思路引導 VIP
當我們面對一個完全未知的現象時,您認為是「先建立一套嚴格的預設規則,要求資料符合這些規則」比較能發現新發現,還是「先廣泛觀察所有細微的數據,再從中總結出可能的規律」比較契合大數據的精神呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能準確選出 (C) 這個選項,代表你已經不只是從字面上理解「巨量資料」,而是真正掌握了它與傳統統計建模在思維上的本質差異。這題的難度在於它不僅考驗定義,更考驗對數據邏輯的深度理解。
歸納法與演繹法的思維翻轉
在傳統資料庫系統中,我們通常採用 由上而下 (Top-Down) 的方式,必須先定義好資料結構(Schema)再存入資料;然而,巨量資料分析的核心在於從海量且雜亂的數據中,利用數學歸納推理進行 由下而上 (Bottom-Up) 的探索,目的是挖掘出隱藏的模式與關聯性。選項 (A) 和 (B) 提到的「多樣性」與「非結構化資料」正是大數據著名的 5V 特性,忽略它們就失去了大數據分析的意義;而選項 (D) 提到的傳統資料庫往往難以負荷如此龐大且快速變動的運算需求,因此需要如 Hadoop 或 Spark 等分散式技術來輔助。
▼ 還有更多解析內容