搭建推荐系统所需要的材料
搭建推薦系統所需要的材料
- 人力物力
- 推薦系統的原材料
- 物品
- 流量
- 最后
人力物力
在上一小節中《推薦系統的必要性》里已經討論過一個推薦業務團隊需要哪些人員儲備,需要什么核心技術等。這里在重點說下物力,即機器資源設備。
往往從頭開始搭建這樣一個團隊,的確是比較花時間,金錢,人工的。
第一,人員的招聘是一個很難的工作,從JD的發出,簡歷的篩選,電話溝通,預約面試,一面,二面,終面,約定入職時間等等。這都是需要很多人花費很多時間去完成,但是即使這樣做了,也不一定招到合適的人員;其次,合適的面試者不一定會接受offer。尤其是算法工程師、高級java開發、大數據的確是比較難招的崗位,有時候,一天要面試4、5個候選人,還要對其面試表現做書面的評價,這在初期會占用幾乎所有的工作時間。
第二,招到了合適的核心技術人員之后,就可以做初期的業務評估,需求整理,進而進行設備的評估與購買。要想自建推薦系統(那么你的流量一定不小),大數據平臺一定少不了。最重要的硬件設備是服務器、辦公電腦、甚至GPU都是需要花費大量金錢的。
有些公司自建整套系統,也就是從無到有,往往轉變不了思想觀念。認為花錢買那么多的機器設備,不一定能為公司賺回成本,以致于在硬件設備采購上把握很嚴格。那么一個直接的影響就是,你每天都要為工程師團隊付出薪水,而不舍得一次性付出硬件成本,一個小時可以跑完的任務,要等5、6小時。人工成本無形地在損耗,一定要想明白這件事,不要在硬件上節省,人工成本最貴!
人工成本 >> 其他花費
推薦系統的原材料
在有了推薦團隊、硬件設備后,就是推薦團隊負責人要發揮重要作用的時候了。要明確自己將要做的推薦業務是什么,目標是什么?提升收入?提高點擊率?增加用戶停留時長?進而考慮推薦系統中的兩個關鍵點:推薦的物品、流量!
物品
對于新聞資訊業務來說,推薦的物品就是新聞內容。比如今日頭條信息流推薦,它要推薦的就是新聞資訊。
對于廣告來業務網說,推薦的物品就是廣告。比如今日頭條廣告推薦
其他推薦就不一一舉例了。
明確了要推薦的物品以及形式是怎樣的,關注一下物品的數量,也就是之前提到的是否有足夠多的物品讓系統去推薦?還是只要運營人員手工即可完成推薦?
流量
一定要清楚目前業務的流量情況是怎樣的?
流量大小
流量分布
人群特征
明確了流量大小、分布以及物品數量,也就知道了推薦系統大致能建立多少鏈接。人群特征是需要做數據分析和用戶畫像的(這塊后續詳細講到)。
明確流量大小和分布有助于安排算法任務的運行時間和算法的選擇,計算框架的選擇。有些需要集群計算,有些單節點服務器就可以完成。還有助于清楚地知道大致需要多少應用服務器等。
其實,互聯網行業的一句話說明了流量的重要價值:流量為王。有了流量,你就有機會盈利,有機會將業務做大。但是,現今互聯網行業的流量已經被各大應用分的所剩無幾了,現在毫不夸張的說是流量稀缺時代!
最后
最后放一張廣告推薦的過程圖:
總結
以上是生活随笔為你收集整理的搭建推荐系统所需要的材料的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 互联网晚报 | 4月11日 星期一 |
- 下一篇: 【DM8168学习笔记5】EZSDK目录