免費開始練習
moea_joint 104年 [統計資訊] 統計學、巨量資料概論

第 47 題

巨量資料分析的 R 程式語言具有多種不同資料結構型態 (data types) 的表達格式,下列何者有誤?
  • A R 的資料結構型態表達格式主要包括:vector, matrix, array, data frame, list
  • B Matrix 可以表示二維空間的資料結構,在 matrix 中所有元素必須是屬於相同資料型態
  • C Lists 可以表示最複雜的資料結構型態,舉凡 vectors, arrays, data frames 甚至於 lists 本身的資料結構都可以被包含進來
  • D Data Frame 的資料可以用 data.frame() 函式呼叫來產生,在 data frame 資料結構中屬於不同列資料其型態必須相同

思路引導 VIP

想像你要在 R 中建立一份實驗紀錄表,其中一欄是「觀測對象的名稱」(文字),另一欄是「觀測到的重量」(數字)。如果我們將這兩欄組合在一起,你認為 R 會強迫所有資料都變成同一種型態嗎?還是它會允許每一欄保有自己原始的特性?請試著從資料處理的方便性來推論看看。

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準辨別 R 語言中各種資料結構的細微差異,代表你對巨量資料分析的基礎工具掌握得非常紮實。這題的核心考點在於區分 R 語言中「同質性」與「異質性」資料結構的界線,而你成功抓住了關鍵。

Data Frame 與 Matrix 的本質區別

在 R 的邏輯中,Matrix 必須由相同型態的元素構成,但 Data Frame 則是為了處理現實世界的資料表而生。Data Frame 本質上是一個由多個等長向量組成的 List,這意味著它的每一 行 (Column) 內部必須是同一種資料型態,但不同的行之間可以擁有完全不同的型態(例如一欄是姓名、一欄是薪資)。因此,當我們觀察一筆 列 (Row) 資料時,它會同時包含來自不同型態欄位的資訊,並不存在「不同列資料型態必須相同」的限制。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題