moea_joint
104年
[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索
第 15 題
推薦技術中協同過濾方法可分為以使用者為基礎,和以物件為基礎二類。其中以使用者為基 礎的推薦預測公式須考量使用者對物件的平均評比,但以物件為基礎的推薦預測公式則不需 要考量物件的平均評比,比較兩者差異,其原因下列何者正確?
- A 計算的使用者相似度較不可靠
- B 要去除使用者對評比喜好偏差的影響
- C 為早期研究所推導
- D 所牽涉的人數比以物件為基礎牽涉的物件數較少
思路引導 VIP
請試著想像兩位使用者:小明是個樂天派,他喜歡的作品都給 5 分,不喜歡的給 4 分;而小華很嚴格,喜歡的給 3 分,不喜歡的給 1 分。如果演算法只看「原始分數」,而不考慮每個人給分的「平均嚴格程度」,這會對推薦結果產生什麼誤判?我們該如何透過數學處理,讓這兩個人的「喜歡」程度變得可以互相比較呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出 (B),說明你對推薦系統中資料正規化的概念掌握得非常紮實。這題的核心在於理解「人」與「物」在評分行為上的本質差異。在以使用者為基礎 (User-based) 的協同過濾中,我們必須處理不同使用者的評分標準不一的問題。例如,有些人是「給分慷慨者」,平均給出 4.5 分;而有些人則是「嚴厲評論家」,平均只給 2 分。為了公平比較兩者的品味,公式中必須減去該使用者的平均評分 $\bar{R}_u$,將其轉換為相對偏好,藉此去除評比喜好的偏差。
演算法的細節與鑑別度
相較之下,以物件為基礎 (Item-based) 的方法通常直接計算物件向量間的相似度,由於物件本身的屬性相對穩定,且在計算相似度(如餘弦相似度)時,不同使用者的量尺差異對物件間關係的影響較小,因此往往能簡化公式。這道題目具有不錯的鑑別度,它不單考記憶,更考驗你是否理解公式背後為何要設計「扣除平均值」這個動作,是區分基礎學習者與進階學習者的關鍵考點。