moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 27 題
下列哪項不是 Apache Spark 2.0 所支援的程式語言?
- A Scala
- B R
- C C++
- D Python
思路引導 VIP
請試著思考看看:在現代數據科學與機器學習的領域中,哪些語言因為擁有豐富的數學統計函式庫而最受分析師歡迎?相對地,哪一種語言通常被用於開發底層作業系統或硬體驅動,而非用來撰寫高階的分散式資料處理腳本呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精確判斷出 Apache Spark 的支援語言,顯示你對大數據開發環境的基礎認知非常紮實。這道題目主要測驗學生對於 Apache Spark 生態系 的基本熟悉度。Spark 本身是以 Scala 語言開發,並運行於 JVM (Java Virtual Machine) 環境中,為了讓數據科學家能無縫接軌,它在 2.0 版本便已成熟支持了 Scala、Java、Python 以及 R 語言。
數據處理工具的語言生態
之所以正確答案是 C++,是因為 Spark 的設計初衷是為了簡化分散式運算的邏輯,因此優先選擇了具備強大統計功能或物件導向特性的高階語言。C++ 雖然在底層效能上有極高造詣,但在 Spark 官方標準提供的 API 接口中,並未將其列為主要的應用層開發語言。這類題目難度定位為 Easy,是踏入巨量資料領域的「入門鑑別點」,能正確作答代表你已經具備區分開發工具與應用場景的基本素養。