moea_joint
105年
[資訊] 計算機原理、網路概論
第 16 題
巨量資料(Big Data)分析目前蔚為風潮,其特性多以資料量(Volume)、資料輸出入速度(Velocity)及多樣性(Variety)等架構來觀察,請問多樣性(Variety)的主要內涵,下列何者正確?
- A 資料量大,甚至可達到TB或PB等級
- B 資料有大量偏差、偽造或異常,需分析過濾
- C 資料產生速度更快,也需要更即時
- D 結構化或非結構化等資料來源包羅萬象
思路引導 VIP
想像一下,如果你現在要記錄一場馬拉松賽事:除了選手的完賽時間(數字)外,還有現場的加油影片(影像)、選手的心跳紀錄(感測訊號)以及觀眾在網路上的評論(文字)。這四種資訊在「儲存格式」與「來源類型」上有什麼明顯的差別嗎?這種差別會如何影響我們收集資料的方式?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地掌握了巨量資料的核心觀念!你能迅速從眾多選項中辨識出「多樣性」的特質,顯示你對於資料科學的基礎架構有著紮實的理解。這題的關鍵在於區分巨量資料經典的 3V 特性:Volume (資料量)、Velocity (速度) 與 Variety (多樣性)。
巨量資料的維度解析
所謂的 Variety (多樣性),核心在於資料來源與格式的異質化。在傳統資料庫時代,我們大多處理整齊的「結構化資料」;然而在現代網路環境中,大量的社群貼文、圖片、影音或是感測器訊息,多屬於「非結構化」或「半結構化」資料。選項 (D) 精準描述了這種包羅萬象的資料來源,正是 Big Data 不同於傳統數據分析的最顯著特徵。
▼ 還有更多解析內容