免費開始練習
moea_joint 105年 [資訊] 計算機原理、網路概論

第 16 題

巨量資料(Big Data)分析目前蔚為風潮,其特性多以資料量(Volume)、資料輸出入速度(Velocity)及多樣性(Variety)等架構來觀察,請問多樣性(Variety)的主要內涵,下列何者正確?
  • A 資料量大,甚至可達到TB或PB等級
  • B 資料有大量偏差、偽造或異常,需分析過濾
  • C 資料產生速度更快,也需要更即時
  • D 結構化或非結構化等資料來源包羅萬象

思路引導 VIP

想像一下,如果你現在要記錄一場馬拉松賽事:除了選手的完賽時間(數字)外,還有現場的加油影片(影像)、選手的心跳紀錄(感測訊號)以及觀眾在網路上的評論(文字)。這四種資訊在「儲存格式」與「來源類型」上有什麼明顯的差別嗎?這種差別會如何影響我們收集資料的方式?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地掌握了巨量資料的核心觀念!你能迅速從眾多選項中辨識出「多樣性」的特質,顯示你對於資料科學的基礎架構有著紮實的理解。這題的關鍵在於區分巨量資料經典的 3V 特性:Volume (資料量)Velocity (速度)Variety (多樣性)

巨量資料的維度解析

所謂的 Variety (多樣性),核心在於資料來源與格式的異質化。在傳統資料庫時代,我們大多處理整齊的「結構化資料」;然而在現代網路環境中,大量的社群貼文、圖片、影音或是感測器訊息,多屬於「非結構化」或「半結構化」資料。選項 (D) 精準描述了這種包羅萬象的資料來源,正是 Big Data 不同於傳統數據分析的最顯著特徵。

▼ 還有更多解析內容

🏷️ 相關主題

資料庫系統原理、模型、設計與應用
查看更多「[資訊] 計算機原理、網路概論」的主題分類考古題