調查局三等申論題
108年
[資訊科學組] 資料庫應用
第 一 題
📖 題組:
關聯式資料庫的技術已經相當成熟,也已經被一般企業或政府機構廣為使用,但是近年來又出現大數據(Big data)的議題,以及 NoSQL 類的資料庫軟體。 (一)請問你認為「大數據」所欲處理的資料,與一般傳統資料庫處理的資料,有何不同之處? 請列出最明顯的 3 點特性並解釋之。(10 分) (二)請問你認為那類軟體比較適合處理大數據?是常用的關聯式資料庫軟體,譬如 MySQL、SQL Server 等,還是 NoSQL 類的軟體,如 MongoDB、Cassandra、HBase 等,請詳述你的理由。(10 分)
關聯式資料庫的技術已經相當成熟,也已經被一般企業或政府機構廣為使用,但是近年來又出現大數據(Big data)的議題,以及 NoSQL 類的資料庫軟體。 (一)請問你認為「大數據」所欲處理的資料,與一般傳統資料庫處理的資料,有何不同之處? 請列出最明顯的 3 點特性並解釋之。(10 分) (二)請問你認為那類軟體比較適合處理大數據?是常用的關聯式資料庫軟體,譬如 MySQL、SQL Server 等,還是 NoSQL 類的軟體,如 MongoDB、Cassandra、HBase 等,請詳述你的理由。(10 分)
📝 此題為申論題,共 2 小題
小題 (一)
請問你認為「大數據」所欲處理的資料,與一般傳統資料庫處理的資料,有何不同之處? 請列出最明顯的 3 點特性並解釋之。(10 分)
思路引導 VIP
看到大數據特性的題目,首要聯想必定是業界標準的「3V」模型(Volume, Variety, Velocity)。作答時應將這三點作為標題,並分別與「傳統關聯式資料庫」的特性(資料量小、結構化 Schema、批次處理為主)進行對比,以凸顯差異並獲取完整分數。
小題 (二)
請問你認為那類軟體比較適合處理大數據?是常用的關聯式資料庫軟體,譬如 MySQL、SQL Server 等,還是 NoSQL 類的軟體,如 MongoDB、Cassandra、HBase 等,請詳述你的理由。(10 分)
思路引導 VIP
面對此題,應先明確給出「NoSQL 較適合處理大數據」的結論。接著以大數據的 3V 特性(Volume, Velocity, Variety)為出發點,從「水平擴展能力(Scale-out)」、「資料模型彈性(Schema-less)」與「CAP定理/BASE理論(分散式系統的效能取捨)」三個維度,對比傳統關聯式資料庫的局限性來建立論述。