reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering
中英譯本及下載:http://blog.sina.com.cn/s/blog_586631940100pduh.html
以下是摘要筆記:
?算法應當結合用戶的習慣,用戶特點的分類
觀影習慣是比較單一 還是比較分散
這是不同的
一、推薦的宗旨:推薦應該要幫助顧客找到和發現新的、相關的、有趣的商品。
Recommendations should help a customer find and discover new, relevant, and interesting items.
二、解決推薦問題有三個通常的途徑:傳統的協同過濾,聚類模型,以及基于搜索的方法。
推薦算法
大多數推薦算法,都始于先找出一個顧客集合,他們買過和評級過的商品,與當前用戶買過和評級過的商品有重疊。算法把來自這些相似顧客的商品聚集起來,排除該用戶已經購買過或評級過的商品,并向該用戶推薦其余的商品。
這些算法有兩個最常見的版本:協同過濾和聚類模型。其他算法——包括基于搜索的方法以及我們自己的商品到商品協同過濾——都集中于尋找相似的商品,而不是相似的顧客。針對用戶所購買和評級的每一件商品,算法試圖找到相似的產品,然后聚集這些相似的商品,并給予推薦。?
1.傳統的協同過濾
利用協同過濾來產生推薦,很耗計算,如果降維,則會影響品質。
2.聚類模型
算法的目標是,把該用戶分配到含有最相似顧客的細分人群里,然后,算法再利用該細分顧客人群的購買和評級,來生成推薦。
較之協同過濾,聚類模型有更好的在線可擴展性和性能、復雜和昂貴的聚類計算會離線運行。然而,推薦品質卻是低的
3.基于搜索的方法
基于搜索或內容的方法,將推薦問題視為相關商品的搜索,如果該用戶只有少數購買或評級,基于搜索的推薦算法在計算量和性能上都不錯。然而,對于有數千次購買的用戶,要以針對所有商品的查詢為基礎也不太可行,若使用子集則又降低了品質。
三、電子商務推薦算法的環境挑戰:
? 大型零售商有海量的數據,以千萬計的顧客,以及數以百萬計的登記在冊的不同商品。
? 許多應用要求結果實時返回,在半秒之內,還要產生高質量的推薦。
? 新顧客很典型,他們的信息很有限,只能以少量購買或產品評級為基礎。
? 較老的顧客信息豐沛,以大量的購買和評級為基礎。
? 顧客數據不穩定:每一次交互都可提供有價值的顧客數據,算法必須立即對新的信息作出響應。
?
商品到商品的協同過濾
?
把推薦作為一種定向營銷工具。(每有一個用戶,就有一個用戶的個性化商店)
它如何工作
協同過濾的變種,將商品分類,而不是用戶
對于非常大的數據集,一個可擴展的推薦算法必須離線運行最昂貴的計算。而現有方法達不到這樣的要求:
? 傳統的協同過濾只做很少或不做離線計算,其在線計算量取決于顧客和登記在冊商品的數量。在大數據集的情況下,這樣的算法不可行,除非使用維度降低、抽樣或區隔——所有這些都降低了推薦的品質。
? 聚類模型能離線運行大量的計算,但推薦品質相對較差。出于改進,可以增加人群細分的數量,但這會使在線的用戶-細分人群的分類變得昂貴。
? 基于搜索的模型離線建立起關鍵詞、范疇、作者索引,但不能提供符合興趣、定向內容的推薦。對于購買和評級很多的顧客來說,這些算法的擴展性不佳。
商品到商品協同過濾的可擴展性和性能的關鍵是,它離線建立耗時巨大的相似商品表格。該算法的在線部分——針對當前用戶的購買和評級來尋找相似的商品——計算量獨立于商品目錄的規模或顧客的總數;僅僅取決于該用戶買過或評級過多少個商品。因此,甚至是對于超大數據集,算法也很快速。由于該算法能推薦高度關聯的相似商品,推薦的品質就很出色10。與傳統的協同過濾不同,該算法在用戶數據有限的情況下也能運行良好,在少至2到3件商品的基礎上,產生高品質的推薦。
?連接:
http://blog.sina.com.cn/s/blog_586631940100pduh.html
http://www.xysay.com/amazon-item-to-item-collaborative-filtering-207.html
轉載于:https://www.cnblogs.com/lance-/p/3935327.html
總結
以上是生活随笔為你收集整理的reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 组态软件mcgs入库mysql_昆仑通态
- 下一篇: 20145313张雪纯《信息安全系统设计