推荐系统笔记(简单概念)
本部分思維導(dǎo)圖:
?
? ? ? ? 推薦系統(tǒng)從搜索引擎借鑒很多技術(shù)和思想,比如內(nèi)容推薦有不少技術(shù)就來自搜索引擎, 基于用戶和基于物品的協(xié)同過濾將推薦系統(tǒng)技術(shù)從內(nèi)容延伸到協(xié)同關(guān)系,超越內(nèi)容本身,后來Netflix舉行一個比賽,以矩陣分解為代表的評分預(yù)測算法出現(xiàn),推薦系統(tǒng)是AI的分支之一,AI落地都需要具備幾個元素:數(shù)據(jù)、算法、場景、計算力
1、概念:
推薦系統(tǒng):
1)、能做什么:可以把那些最終會在用戶和物品之間產(chǎn)生的鏈接提前找出來
2)、需要什么:需要根據(jù)已經(jīng)存在的連接,從已有的連接去預(yù)測未來的連接
3)、它怎么做:預(yù)測用戶評分和偏好---》定義抽象實現(xiàn)方式分類是:機器推薦和人工推薦,也就是常說的個性化推薦和編輯推薦
總結(jié):推薦系統(tǒng)就是用已有的連接去預(yù)測未來用戶和物品之間會出現(xiàn)的連接
注:
世界的發(fā)展趨勢是萬物傾向于建立越來越多的聯(lián)系,人是一起意義所在,根據(jù)已有的連接預(yù)測和人有關(guān)的連接
例如:一個電商平臺,用戶剛買過什么,常買什么,這些都是用戶和商品之間的連接,用這些連接去預(yù)測還會買什么,還會瀏覽什么
?
2、怎么評判公司是否需要構(gòu)建推薦系統(tǒng)?
1)、產(chǎn)品的目的:如果產(chǎn)品是建立越多連接越好,那么它最終需要一個推薦系統(tǒng)
2)、產(chǎn)品現(xiàn)有的連接:如果產(chǎn)品中物品很少,可以用人工就可以應(yīng)付過來,則不適合搭建推薦系統(tǒng)
3、推薦系統(tǒng)的問題模式
推薦系統(tǒng)是為用戶和物品建立連接,建立的方式是提前找出那些隱藏的鏈接呈現(xiàn)給用戶,這也屬于一個預(yù)測問題:
針對推薦系統(tǒng)的預(yù)測問題模式,主要分為兩大類:1)、評分預(yù)測(顯式反饋)? 2)、行為預(yù)測(隱式反饋)
1) 評分預(yù)測:
? ? ? ?例如用戶消費完一個物品會給出一個評分,或者有的網(wǎng)站是用星星的棵數(shù)表示。提前預(yù)測一個用戶對每一個物品會打多少分,找出那些可能會打高分,但是還沒消費的物品,然后推薦給用戶。
評分預(yù)測存在的問題:
? ? ? 1)數(shù)據(jù)不易收集? ?2)數(shù)據(jù)質(zhì)量不能保證? ?3)評分的分布不穩(wěn)定
2)行為預(yù)測
只要用戶瀏覽相關(guān)信息,就會有各種行為數(shù)據(jù)產(chǎn)生,從登錄、瀏覽到購買收藏,都是用戶行為,這些行為都是在用戶不知不覺下的情況下產(chǎn)生,數(shù)據(jù)量比較多。
? ? ? ?推薦系統(tǒng)目前預(yù)測行為方式主要有兩種:直接預(yù)測行為本身發(fā)生的概率、預(yù)測物品的相對排序。直接預(yù)測行為本身稱為:CTR預(yù)估(Click Through Rate).把每一個推薦給用戶的物品按照是否點擊二分類,構(gòu)建分類模型,預(yù)估其中一種分類的概率,就是ctr預(yù)估。
行為預(yù)測,就簡單的來說是利用隱式反饋數(shù)據(jù)預(yù)測隱式反饋發(fā)生的概率。
行為預(yù)測有幾個特點:
? ? ?1) 數(shù)據(jù)比顯示反饋更加稠密? ?2)隱式反饋更代表用戶的真實想法? 3)隱式反饋常常和模型的目標(biāo)函數(shù)關(guān)聯(lián)更密切
4、推薦系統(tǒng)常見問題
1)冷啟動問題
新用戶或者不活躍用戶,以及新物品或展示次數(shù)比較少的物品,這些用戶和物品,由于缺乏相關(guān)數(shù)據(jù),這就是冷啟動問題的關(guān)注對象
2)探索和利用問題(exploration?& exploitation )
如果知道用戶喜好,一般會有三種方式應(yīng)對:1、全部推薦用戶目前肯定感興趣的物品? 2、無視用戶興趣,按照其它邏輯推薦 3、大部分推薦感興趣的,小部分去試探新的興趣。顯然第3種更科學(xué)一些
3)? 安全問題:
推薦系統(tǒng)被攻擊的影響主要有幾個方面:1、給出不準(zhǔn)確的推薦結(jié)果? 2、收集很多臟數(shù)據(jù)? 3、損失產(chǎn)品的利益
總結(jié):從模型的角度,推薦系統(tǒng)的模型可以分成預(yù)測評分和預(yù)測行為,另一個角度可以看看推薦系統(tǒng)中存在一些潛在的問題,包括冷啟動、搜索和利用問題、安全問題。
5、推薦系統(tǒng)關(guān)鍵元素的重要性
開發(fā)推薦系統(tǒng)產(chǎn)品,幾個元素需要注意:
1)UI和UE:人機交互設(shè)計和用戶體驗設(shè)計
2)數(shù)據(jù)
3)領(lǐng)域知識
4)算法
6、建立思維模式
1)目標(biāo)思維:
對于結(jié)構(gòu)有預(yù)期,可以提前推演出來。
可以把推薦系統(tǒng)看做一個函數(shù),輸入有很多:UI、UE、數(shù)據(jù)、領(lǐng)域知識、算法等等;輸出是我們關(guān)注的指標(biāo):留存率、新聞的閱讀時間、電商的GMV、視頻的VV等等
2)不確定性思維:
不需要用因果邏輯地提前推理出來,而是用概率的眼光去看結(jié)果。
推薦系統(tǒng)的產(chǎn)品負責(zé)人一定要有不確定性思維,原因如下:
1)絕大多數(shù)推薦算法都是概率算法,無法保證得到確切的結(jié)果,只是概率上得到好的效果
2)推薦系統(tǒng)追求的是目標(biāo)的增長,而不是一城一池的得失
3)如果花時間為一個事件增加補丁,那么付出的成本和得到的收益將大打折扣
4)出現(xiàn)意外的推薦也是有益的,可以探索用戶的新興趣
?
總結(jié)
以上是生活随笔為你收集整理的推荐系统笔记(简单概念)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GBDT基本原理及应用
- 下一篇: 推荐系统笔记(内容推荐)