CF、FM、DSSM、DeepFM等这些推荐模型的原理以及使用场景是什么?
由于近些年深度學習技術的飛速發展,大力加速推動了AI在互聯網以及傳統各個行業的商業化落地,尤其是推薦系統、計算廣告等領域。由于推薦系統與提升用戶量以及商業化變現有著密不可分的聯系,各大公司都放出了眾多推薦系統相關職位,且薪水不菲,目前發展勢頭迅猛。?
大多數欲從事推薦系統相關工作的同學,往往都是通過自學的方式來進行學習,但是這樣很明顯的問題是:
1. 雖然學習了解了很多推薦算法模型,如:協同過濾、FM、DeepFM等,但是卻不清楚這些模型在工業界推薦系統中是如何串聯、如何配合、有哪些坑,哪些trick的,導致無論面試還是真正去業界做推薦系統,都會被推薦領域的”老槍老炮“們一眼識別出小白屬性。
2. 對于算法原理理解不深刻,這就會導致實際應用時不能很好地將模型的性能發揮出來,另外面試時對于大廠面試官的刨根問底,只能是眼睜睜的丟掉offer。
CF、FM、DSSM、DeepFM等這些推薦業界明星模型,你真的清楚他們的內部運行原理以及使用場景嗎?真的了解FM模型與SVM有什么相似之處嗎?FM固然可以用作為打分模型,但它可以用來做matching嗎,如果可以,如何做?item2Vec模型在業界是如何緩解冷啟動的問題的?雙塔模型優勢在哪?深度模型到底是如何做matching的,是離線計算好結果還是實時的對網絡進行前向計算?DeepFM具體實現時,wide端和deep端的優化方式是一樣的嗎?基于Graph的推薦方法在業界的應用目前是怎樣的?
為了真正全面系統的培養面向工業界的推薦系統人才,貪心學院推出了《推薦系統工程師培養計劃3期》,在前兩期的基礎上做了全面升級,深度探索推薦系統算法知識,并落地實操工業級項目,由資深的推薦系統負責人全程直播講解,幫助你融會貫通,輕松拿offer。?
推薦系統工程師培養計劃
助你成為行業TOP10%的工程師
對課程有意向的同學
掃描二維碼咨詢
01 課程大綱
第一部分:推薦系統之內容理解與畫像構建
Week1?機器學習基礎 邏輯回歸模型 梯度下降法 神經網絡模型 過擬合與正則 常用的評價指標 常用的優化算法 向量、矩陣基礎 | Week2 推薦系統基礎 推薦系統概述、架構設計 推薦系統后臺數據流設計 常用的技術棧 推薦系統中的評價指標 簡單的用戶協同 環境搭建 |
Week3 內容畫像的構建以及NLP技術 內容畫像的搭建基礎 關鍵詞提取技術tf-idf,?textRank LSTM與注意力機制 Attention的幾種常用方式 Self-Attention Multi-head Attention 雙線性Attention NLP工具的使用 MySQL數據庫的搭建與內容畫像存儲 | Week4 用戶畫像的構建 用戶畫像與內容畫像的關系 用戶畫像的架構 用戶畫像的擴展 用戶畫像與排序特征 用途:基于標簽的用戶畫像 標簽權重的計算方法(貝葉斯平滑、時間衰減) 基于用戶畫像的召回方法 Redis的搭建與使用 基于Redis的用戶畫像存儲 Hadoop, Hive, Spark等工具使用 |
第二部分:召回模型與策略、數據與采樣的學問
Week5 傳統Matching方法 MF召回法以及求解 特征值分解 傳統奇異值分解之SVM FunkSVD? ALS方法 SVD++ 基于物品的協同Item-CF | Week6 深度 Matching方法 理解Embedding技術 Embedding為什么有效 Embedding與稀疏ID類特征的關系 Item-CF召回與Item2Vec Airbnb序列召回與冷啟動緩解思路 NCF召回以及變種 YouTube召回方法 從DSSM到雙塔模型 雙塔模型工業界的部署方法 多興趣召回 MIND召回 Faiss工具介紹? KD樹,LSH,Simhash |
Week7 Graph Embedding與用戶行為構建圖 隨機游走于傳統協同方法 Deepwalk Node2Vec及其同質性與結構性 LINE? 隨機游走的實現 Alias采樣方法 Neo4j講解 Graph Embedding的實現 Node2Vec的實現 | Week8 圖推薦、圖神經網絡、采樣與熱度打壓 Graph Embedding優化 EGS,注意力機制及其變種 Ripple網絡方法 召回層采樣的坑與技巧 熱度抑制 EGES的實現 GCN和GAT? GraphSage |
第三部分:排序模型、重排序與多目標
Week9 經典Ranking模型方法 Ranking與用戶畫像 物品畫像 LR模型 GBDT+ LR FM模型詳解、業界使用方法與坑 FFM模型 AUC與GAUC 增量學習與Online Learning 從L1稀疏化、FOBOS到FTRL算法 基于FM實現Ranking精排序 | Week10 深度Ranking模型與工業采樣技巧 粗排與精排及其意義 主流深度推薦模型的幾種范式 特征自動組合:Deep&Cross, XDeepFM, PNN 特征重要度提取以及無用特征去噪:AFM,DeepFFM 序列推薦模型:DIN,DIEN,AttRes,Stamp 獨辟蹊徑之序列推薦的優化思路 深度模型工具的介紹與使用 MLSQL DeepCTR等與工業界采樣方法 |
Week11 重排序與多目標學習 多目標學習的幾種范式 范式一:樣本加權 范式二:多模型融合 范式三:聯合訓練、ESMM,MMOE框架,ESM2等 ESMM的實現 |
第四部分:實時召回策略與前沿推薦技術
Week12-13 工業界新聞推薦系統中冷啟動與熱點文章實時召回 人群分桶 實時交互正反饋 實時召回與實時畫像技術 人群投票 人群等級投票 降維分發 后驗與先驗的結合 引入注意力機制的優化興趣增加和衰減 熱點文章召回策略 本地文章召回策略 算法策略與運營配合協作 | Week14 強化學習與推薦系統、AutoML與推薦系統 強化學習概念、以及在推薦系統中的對應 DP算法本質思想 馬爾科夫決策 蒙特卡洛搜索所樹(MCTS) UCB及其在推薦系統中的應用 湯普森采樣法 Q-Learning、DRN、策略梯度 強化學習在推薦場景中的應用 |
Week15 項目總結,部署以職業規劃 工業界項目的部署 推薦系統崗位的面試要點 大廠的面試攻略 如何準備簡歷、包裝自己 職業規劃 |
推薦系統工程師培養計劃
助你成為行業TOP10%的工程師
對課程有意向的同學
掃描二維碼咨詢
02?課程中的實戰項目
1.?相似推薦場景項目
? ?項目描述:
工業界中,推薦系統已經逐步滲入到各個場景下,從最常見的信息流、首頁猜你喜歡等,到看了又看、買了又買,以及相似物品推薦等。本項目將以此為切入點,帶領學員們體驗相似推薦場景的算法與工具、以及工業界的使用經驗、心得、trick。
???項目預期結果:
掌握相似推薦場景的常用算法和工具、以及使用經驗,具備獨立完成相似推薦場景的能力。
2. 資訊信息流召回場景項目
???項目描述:
目前業界最主流的推薦系統使用“多路召回+精排”的方式,本項目中,帶你掌握這種工業界最流行的推薦方式,你將使用DSSM等深度網絡算法,并基于ANN檢索的方式實現召回,最后使用精排,對每個候選物品進行打分并排序,最后按照得分對用戶進行物品展示,用此種方式還原真實工業界場景。?
???項目預期結果:
此項目將為學員帶來完整的工業界推薦算法與數據流,麻雀不大,但五臟俱全,令你掌握深度召回、向量化檢索、深度排序以及工程化部署等,完全具備一個合格的推薦算法工程師能力。
3.?多目標排序場景項目
???項目描述:
隨著推薦系統的發展,無論是流量化場景,還是商業化場景,多目標的擬合在推薦系統中的重要性,慢慢的從小荷才露尖尖角,迅速的發展成為執牛耳的地位,本項目將多目標排序單獨作為一個模塊,分別利用工業界經典以及最新方法來體驗多目標排序的美妙。
???項目預期結果:
掌握推薦領域的高階技術-多目標排序的算法的工程實踐,在深度排序的基礎上進一步拓展排序的優化空間。
推薦系統工程師培養計劃
助你成為行業TOP10%的工程師
對課程有意向的同學
掃描二維碼咨詢
03部分案例和作業
01
實現基于用戶協同的文本推薦
在深度學習盛行的時代,經典的協同過濾方法是否還在各大公司的推薦引擎中使用呢?答案是肯定的,協同算法在推薦領域中有這不可磨滅的基因,作為分發和傳播能力極強的方法,至今,協同過濾方法仍然在工業界有這廣泛的應用。此案例中,同學們將親手實踐協同算法的威力。
02
基于NLP技術、Redis構建與存儲內容畫像
用戶畫像在推薦領域有著至關重要的作用,主流的協同以及今天大火的深度召回方法,如雙塔、YouToBe召回方法等的情況下,基于用戶畫像的召回方法仍然適用,因其極具可控性與解釋性,推薦領域,因其有這天然的業務性,導致推薦系統對可解釋性要求極高,當出現推薦的bad case時,基于用戶畫像的召回策略是查找bad case的重要手段。
03
Item2Vec的實現
推薦業務領域常常有如下場景,相關推薦、猜你還喜歡等,熟悉吧?背后支持的算法和系統策略邏輯是什么呢?答案就在此案例中,類似的相關推薦場景,即為:根據現有物品推薦另一相關的物品或者商品,借助于用戶行為與word2vec思路,將item Embedding引入此場景,并適當引入side info信息來做商品的相關推薦方法,此案例將為你揭曉其中的秘密。
04
FM方法的實現
MF(矩陣分解)算法作為推薦算法經典代表作之一,其是最早體現出Embedding泛化擴展思想的雛形;之后,FM(因子分解機)算法在MF(矩陣分解)基礎之上發揚光大,將Embedding思想進一步引入傳統的機器學習做推薦,FM算法看成推薦領域的萬金油,召回、粗排、精排均可用FM實現,在深度學習上線資源較困難的情況下,可視為推薦領域的baseline的不二法門,此案例中,你將親自感受FM算法的魅力。?
05
Wide&Deep算法實現
推薦算法本質上就是在解決兩個問題:記憶和泛化,傳統的LR等模型,將大量的ID類稀疏特征直接喂給模型,再由廣義線性模型直接學習這些ID類特征的權重,本質上就是模型對特征的簡單粗暴的記憶,因此,泛化擴展性得不到保證,從未出現過的特征(如很重要的交叉特征等),模型無法學習該特征權重,故特征的指征能力無法體現。
因此,深度學習模型引入Embedding稠密向量概念,將不同特征之間的一部分共性抽象出,放入Embedding空間進行學習,這樣的操作可以近乎看作是模糊查找,具有較強的泛化能力,但記憶性顯然不如LR等模型,wide&&deep的提出是兼容記憶性與泛化性的考慮,在此基礎上,后續的DeepFM等模型,也只是在wide端加強了模型對特征的顯式交叉,但架構本質與wide&&deep模型是一樣的。此案例就來帶大家實操WDL方法。
推薦系統工程師培養計劃
助你成為行業TOP10%的工程師
對課程有意向的同學
掃描二維碼咨詢
04?學習收獲
1.?掌握每一個核心技術點、學完之后在技術上可滿足絕大部分推薦系統崗位的要求
2.?深入理解每一個技術背后的算法細節和全部推導過程
3.?通過大量案例的實戰,達到學以致用的目的,并學習工業界一線的經驗
4.?緊跟技術的發展、走在時代的前沿
05 課程適合誰?
大學生
l理工科相關專業的本科/碩士/博士生,畢業后想從事AI工作的人
l今后想從事推薦系統相關工作的人
l希望能夠深入AI領域,為科研或者出國做準備
l希望系統性學習推薦相關的技術
在職人士
l目前從事IT相關的工作,今后想做跟推薦相關的項目
l目前從事AI相關的工作,希望與時俱進,加深對技術的理解
l希望能夠及時掌握前沿技術
06?入學標準
1.?理工科相關專業學生,或者IT從業者
2.?具有良好的Python編程能力
3.?掌握機器學習基礎(如線性回歸、邏輯回歸、SVM等)
07?報名須知
1. 本課程為收費教學。
2.?剩余名額有限。
3.?品質保障!正式開課后7天內,無條件全額退款。
4. 學習本課程需要具備一定的機器學習基礎。
推薦系統工程師培養計劃
助你成為行業TOP10%的工程師
對課程有意向的同學
掃描二維碼咨詢
總結
以上是生活随笔為你收集整理的CF、FM、DSSM、DeepFM等这些推荐模型的原理以及使用场景是什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】相当全面的Pandas文
- 下一篇: 【Python】疫情卷土重来?Pytho