开放下载!基于PAI个性化推荐系统开发指南
亞馬遜的CEO Jeff Bezos曾經(jīng)說過,他的夢想是“如果我有100萬個用戶,我就要為他們做100萬個亞馬遜網(wǎng)站”。而智能推薦系統(tǒng)的出現(xiàn),就是為了實現(xiàn)這個夢想,智能推薦系統(tǒng)解決的是一個信息比對的問題,怎么樣基于用戶的信息和商品的信息去做一個更好的匹配,為每一個用戶實現(xiàn)個性化的推薦結(jié)果,這是推薦系統(tǒng)要解決的問題。從“千人一面”到“千人千面”,這個世界因智能推薦系統(tǒng)變得更人性化、更豐富、更美好。
?
推薦系統(tǒng)=推薦算法+系統(tǒng)工程
《個性化推薦系統(tǒng)開發(fā)指南》這本電子書基于PAI構(gòu)建企業(yè)級推薦系統(tǒng),從推薦算法開始,到系統(tǒng)工程問題講解,教你構(gòu)建一個完整的推薦系統(tǒng)。
?
?
目錄
?
什么是推薦系統(tǒng)
伴隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展,人們可以涉獵到更多的資訊。比如說進(jìn)入到一個淘寶的平臺,有非常多的商品,如何將適合用戶的商品去觸達(dá)他,是淘寶需要解決的一個問題。本質(zhì)上,推薦系統(tǒng)解決的是一個信息比對的問題。怎么樣基于用戶的信息和商品的信息去做一個更好的匹配,這是推薦系統(tǒng)要解決的問題。
常見的推薦業(yè)務(wù)場景有兩個。一個是基于搜索Query的推薦,比如說,在淘寶平臺購買一件商品,Query推薦要基于用戶的購買偏好,還有商品的屬性去做一個匹配。另一個是基于用戶和商品屬性的Feed流的推薦,我們采用機器學(xué)習(xí)推薦模型,它既要學(xué)習(xí)用戶,也要學(xué)習(xí)商品的屬性。
推薦系統(tǒng)召回算法
召回算法的作用是從海量待推薦對象中抽選出待排序的候選集。
下面是目前比較流行的4個算法。
- 協(xié)同過濾:基于統(tǒng)計的方式找到相似的item關(guān)聯(lián)關(guān)系以及user-item的關(guān)聯(lián)關(guān)系
 - GraphSage:圖神經(jīng)網(wǎng)絡(luò)召回算法,基于深度學(xué)習(xí)框架構(gòu)建的圖算法。可以基于用戶和商品特征及行為產(chǎn)出user embedding和item embedding。
 
推薦系統(tǒng)排序算法
排序算法的作用是針對推薦的候選集進(jìn)行用戶興趣從強到弱的排序,通常使用機器學(xué)習(xí)領(lǐng)域的二分類算法解決該問題。
目前比較經(jīng)典的排序算法是下面列的這4種。
- 一、邏輯回歸是應(yīng)用非常廣泛的一種算法。它是目前業(yè)內(nèi)最經(jīng)典的線性二分類算法,特點是容易上手,對于計算力要求低,模型可解釋性好。
 - 二,FM算法近一兩年來,在很多客戶的場景中都得到大規(guī)模的應(yīng)用,效果也不錯。它是通過內(nèi)積的方式增強特征的表現(xiàn)力。
 
推薦系統(tǒng)線上服務(wù)編排
1、業(yè)務(wù)場景:客戶業(yè)務(wù)潮汐效應(yīng)很明顯,業(yè)務(wù)高峰基本集中在中午和晚上。
 2、方案:基于高擴展彈性業(yè)務(wù)場景,采用阿里云ACK構(gòu)建整體推理架構(gòu)。
 3、調(diào)用流程:
- 多路召回:物品協(xié)同過濾,語義召回,熱門及運營策略召回取回上千條候選集。
 - 曝光去重:基于該用戶閱讀歷史,去掉已經(jīng)曝光內(nèi)容,去掉基于運營策略不能推薦的內(nèi)容(敏感內(nèi)容)。
 - 排序:推理模塊調(diào)用排序過程時根據(jù)用戶id及物料id,獲取用戶特征及物料特征(Redis)后,分批調(diào)用PAI-EAS服務(wù)返回排序結(jié)果。
 
?
作者介紹
 阿里云人工智能產(chǎn)品專家傲海,長期從事人工智能平臺產(chǎn)品能力建設(shè)和商業(yè)化業(yè)務(wù)。伴隨阿里云機器學(xué)習(xí)PAI平臺從零起步,逐漸成為IDC、Forrester認(rèn)證的國內(nèi)領(lǐng)先的商業(yè)化人工智能平臺之一。《機器學(xué)習(xí)實踐應(yīng)用》書作者,阿里云大學(xué)講師。
原文鏈接
 本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的开放下载!基于PAI个性化推荐系统开发指南的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 浅谈RSocket与响应式编程
 - 下一篇: 基因行业容器存储解决方案