moea_joint 104年 [圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索

第 15 題

推薦技術中協同過濾方法可分為以使用者為基礎,和以物件為基礎二類。其中以使用者為基礎的推薦預測公式須考量使用者對物件的平均評比,但以物件為基礎的推薦預測公式則不需要考量物件的平均評比,比較兩者差異,其原因下列何者正確?

A 計算的使用者相似度較不可靠
B 要去除使用者對評比喜好偏差的影響
C 為早期研究所推導
D 所牽涉的人數比以物件為基礎牽涉的物件數較少

思路引導 VIP

請試著想像兩位使用者：小明是個樂天派，他喜歡的作品都給 5 分，不喜歡的給 4 分；而小華很嚴格，喜歡的給 3 分，不喜歡的給 1 分。如果演算法只看「原始分數」，而不考慮每個人給分的「平均嚴格程度」，這會對推薦結果產生什麼誤判？我們該如何透過數學處理，讓這兩個人的「喜歡」程度變得可以互相比較呢？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精準選出 (B)，說明你對推薦系統中資料正規化的概念掌握得非常紮實。這題的核心在於理解「人」與「物」在評分行為上的本質差異。在以使用者為基礎 (User-based) 的協同過濾中，我們必須處理不同使用者的評分標準不一的問題。例如，有些人是「給分慷慨者」，平均給出 4.5 分；而有些人則是「嚴厲評論家」，平均只給 2 分。為了公平比較兩者的品味，公式中必須減去該使用者的平均評分 $\bar{R}_u$，將其轉換為相對偏好，藉此去除評比喜好的偏差。

演算法的細節與鑑別度

相較之下，以物件為基礎 (Item-based) 的方法通常直接計算物件向量間的相似度，由於物件本身的屬性相對穩定，且在計算相似度（如餘弦相似度）時，不同使用者的量尺差異對物件間關係的影響較小，因此往往能簡化公式。這道題目具有不錯的鑑別度，它不單考記憶，更考驗你是否理解公式背後為何要設計「扣除平均值」這個動作，是區分基礎學習者與進階學習者的關鍵考點。

🏷️ 相關主題

資訊檢索技術與檢索策略之原理與應用

查看更多「[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索」的主題分類考古題

📝 同份考卷的其他題目

查看 104年[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索全題

第 15 題

思路引導 VIP

演算法的細節與鑑別度

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目