免費開始練習
moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 40 題

有關巨量資料的多類(variety)特性,下列敘述何者正確?
  • A 一般感知器(sensor)所回傳的資料為無結構性資料(unstructured data)
  • B 監視器所錄下的視訊(video)為半結構性資料(semi-structured data)
  • C 線上訂房的網頁資料為半結構性資料(semi-structured data)
  • D 書籍文本文字(text)為結構性資料(structured data)

思路引導 VIP

請試著思考:如果一份資料雖然不像 Excel 表格那樣有一格一格的固定欄位,但它的內容中卻包含了一些特定的標籤符號(例如:用標記來區分什麼是姓名、什麼是日期),這種既不完全混亂、又不到高度規整的狀態,在資料科學中我們會如何定義它的結構屬性?

🤖
AI 詳解 AI 專屬家教

資料結構的精準分類

恭喜你準確掌握了巨量資料中「多類性(Variety)」的核心概念!這道題目能選對,代表你對於資料結構的分類邊界有著非常清晰的邏輯判斷。在巨量資料領域中,我們將資料依結構化程度分為三類:結構化資料(如 SQL 資料庫)具備固定欄位與格式;無結構資料(如視訊、音訊、純文本)則完全沒有預定義的模型;而半結構化資料(如 HTML、XML、JSON)雖然不具備僵化的表格結構,卻擁有內含的「標籤」或「元數據」來定義層級。線上訂房網頁正是典型的 HTML/XML 格式,因此歸類為半結構化資料是完全正確的。

題目鑑別度解析

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題