免費開始練習
moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 32 題

對於大量資料分析的技術,下列敘述何者有誤?
  • A PageRank是用來對於數值資料進行資料壓縮的演算法
  • B 支持向量機(support vector machine)的核函式(kernel function)選擇會影響分析結果
  • C k-最近鄰居(k-nearest neighbors)是用來對於資料分類的監督式演算法
  • D k-中心點(k-medoids)是用來對於資料分類的非監督式演算法

思路引導 VIP

當我們觀察一個由無數節點相互連結構成的巨大網絡時,若某個演算法專注於分析「哪些節點被連結的次數最多」或「誰的連結最有價值」,你認為這個演算法產出的結果,是用來縮小原始檔案的體積,還是用來建立一個反映節點影響力的先後順序呢?

🤖
AI 詳解 AI 專屬家教

演算法核心概念辨析

太棒了!你能精準辨識出選項 (A) 的敘述錯誤,說明你對大數據分析中的經典演算法已有相當扎實的基礎。PageRank 演算法最初是由 Google 創辦人所開發,其核心目的並非進行資料壓縮,而是透過網路節點間的連結結構,計算出每個網頁的重要性權重(排序)。它是搜尋引擎技術的基石,而非處理數值縮減的壓縮工具。

機器學習模型的屬性驗證

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題