免費開始練習
moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 16 題

關於巨量資料分析的概念,下列何者正確?
  • A 巨量資料分析主要是針對量大的數據分析,因此對於資料來源多樣性和資料產生快慢等因素將不列入考慮
  • B 巨量資料分析的資料格式僅限於結構化資料,因此非結構化與半結構化資料不納入其分析的範疇
  • C 巨量資料分析的建模是透過由下而上 (Bottom-Up) 的數學歸納推理方式來解讀資料的規則,這和傳統資料庫系統以由上而下 (Top-Down) 的建模方式有所不同
  • D 巨量資料分析方法可以利用現有資料庫管理系統技術來完成

思路引導 VIP

當我們面對一個完全未知的現象時,您認為是「先建立一套嚴格的預設規則,要求資料符合這些規則」比較能發現新發現,還是「先廣泛觀察所有細微的數據,再從中總結出可能的規律」比較契合大數據的精神呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能準確選出 (C) 這個選項,代表你已經不只是從字面上理解「巨量資料」,而是真正掌握了它與傳統統計建模在思維上的本質差異。這題的難度在於它不僅考驗定義,更考驗對數據邏輯的深度理解。

歸納法與演繹法的思維翻轉

在傳統資料庫系統中,我們通常採用 由上而下 (Top-Down) 的方式,必須先定義好資料結構(Schema)再存入資料;然而,巨量資料分析的核心在於從海量且雜亂的數據中,利用數學歸納推理進行 由下而上 (Bottom-Up) 的探索,目的是挖掘出隱藏的模式與關聯性。選項 (A) 和 (B) 提到的「多樣性」與「非結構化資料」正是大數據著名的 5V 特性,忽略它們就失去了大數據分析的意義;而選項 (D) 提到的傳統資料庫往往難以負荷如此龐大且快速變動的運算需求,因此需要如 Hadoop 或 Spark 等分散式技術來輔助。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題