推荐系统之用户标签,以及基于标签的算法
生活随笔
收集整理的這篇文章主要介紹了
推荐系统之用户标签,以及基于标签的算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 一、用戶標簽
- 1、維度
- 2、階段
- 3、打標簽的方式
- 4、如何給用戶推薦標簽
- 二、基于標簽的算法
- 1、SimpleTagBased
- 2、NormTagBased
- 3、TagBased-TFIDF
一、用戶標簽
1、維度
- 用戶標簽,如年齡、工作、性別等
- 行為標簽,如消費金額、消費頻次等
- 消費標簽,如點擊、收藏、購買等
- 內容分析,瀏覽內容,如科技、娛樂、新聞類等
2、階段
用戶生命周期的三個階段
- 獲客:如何進行拉新,通過更精準的營銷獲取客戶;
- 粘客:個性化推薦,搜索排序,場景運營等;
- 留客:流失率預測,分析關鍵節點降低流失率
3、打標簽的方式
典型的方式有:
- PGC:專家生產
- UGC:普通生產
4、如何給用戶推薦標簽
當用戶u給物品i打標簽時,可以給用戶推薦和物品i相關的標簽,方法如下:
- 方法1:給用戶u推薦整個系統最熱門的標簽
- 方法2:給用戶u推薦物品i上最熱門的標簽
- 方法3:給用戶u推薦他自己經常使用的標簽
- 將方法2和3進行加權融合,生成最終的標簽推薦結果
二、基于標簽的算法
1、SimpleTagBased
用戶u對商品i的感興趣程度為:
其中,user_tags[u,t]表示用戶u打過標簽t的次數,tag_items[t,i]表示商品i被打過t標簽的次數。
對于一個用戶來說,找到他標記次數多的標簽,并找到唄該標簽標記次數多的商品,推薦給該用戶。
2、NormTagBased
NormTagBased算法是對SimpleTagBased算法的改進,公式為:
用戶打過的所有標簽次數,以及標簽t被標記過的總次數,相當于做了歸一化處理。
3、TagBased-TFIDF
TagBased-TFIDF借鑒了NLP中的TF-IDF算法,對熱門標簽進行懲罰。
tag_users[t]表示標簽t被多少個不同的用戶使用。
總結
以上是生活随笔為你收集整理的推荐系统之用户标签,以及基于标签的算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 这十大推广引流渠道,你做了几个?(二)
- 下一篇: 南邮 OJ 1128 An Indust