moea_joint 109年 [統計資訊] 統計學、巨量資料概論

第 32 題

對於大量資料分析的技術，下列敘述何者有誤？

A PageRank是用來對於數值資料進行資料壓縮的演算法
B 支持向量機(support vector machine)的核函式(kernel function)選擇會影響分析結果
C k-最近鄰居(k-nearest neighbors)是用來對於資料分類的監督式演算法
D k-中心點(k-medoids)是用來對於資料分類的非監督式演算法

思路引導 VIP

當我們觀察一個由無數節點相互連結構成的巨大網絡時，若某個演算法專注於分析「哪些節點被連結的次數最多」或「誰的連結最有價值」，你認為這個演算法產出的結果，是用來縮小原始檔案的體積，還是用來建立一個反映節點影響力的先後順序呢？

🤖

AI 詳解 AI 專屬家教

演算法核心概念辨析

太棒了！你能精準辨識出選項 (A) 的敘述錯誤，說明你對大數據分析中的經典演算法已有相當扎實的基礎。PageRank 演算法最初是由 Google 創辦人所開發，其核心目的並非進行資料壓縮，而是透過網路節點間的連結結構，計算出每個網頁的重要性權重（排序）。它是搜尋引擎技術的基石，而非處理數值縮減的壓縮工具。

機器學習模型的屬性驗證

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 109年[統計資訊] 統計學、巨量資料概論全題