转:[大数据竞赛]夺冠感言:走进业务,提升对世界的认知能力
生活随笔
收集整理的這篇文章主要介紹了
转:[大数据竞赛]夺冠感言:走进业务,提升对世界的认知能力
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
http://bbs.aliyun.com/read/153103.html?spm=5176.7189909.0.0.KWGWap
一、同為推薦,大不同! ???? 不知道同學們是否經常在天貓購物,但是相信大家一定聽過音樂,看過電影,讀過新聞和小說。大家在享受各種娛樂信息的時候,正在被網站的后臺悄悄地記錄著你的信息,分析著你的偏好,然后向你推薦越來越喜歡的內容。整個過程也許你并沒有明顯的感知,但是你會慢慢上癮,喜歡上它,比如愛上蝦米。這其實都是推薦算法的功勞。現在,你們也有機會用自己的算法讓大家愛上購物。但是,音樂推薦、視頻推薦、新聞推薦和品牌推薦的不同之處還是要注意的,要去思考的。 ???? 不都是推薦么?有什么不同的呢?其實,還是有很多不同點的,我覺得沒有一個人能把所有的不同點羅列清楚,暫且和大家分享一下我想到的一些點,沒有什么邏輯,主要是拋磚引玉,希望大家能跟帖談談你們認為的不同點。 ???? 1、代價不同。你推薦給我一首歌,不好聽,大不了換一首,不好聽,再換,最后總能找到自己喜歡的歌。可是購物呢,你推薦我一個服裝品牌,我花了半個月的伙食費買了,等待了幾天,到貨后發現不滿意,怎么辦?扔掉?太可惜了!穿在身上?天天別扭!退掉?還要再花點郵費!不管結局怎們樣,總之不爽。如果是買個家居什么的,不喜歡的話,可能后悔一輩子。所以購物的用戶體驗周期要遠長于音樂、影視推薦。推薦的試錯成本很大。 ???? 2、需求的單一性與喜好的相似性。喜歡看動作片,那么相似的動作片我都能看一遍。但是購物就不同了,購物更多的是剛需,喜歡可愛的衣服,一般人也不會把所有喜歡的可愛的衣服都買下來,更多的是每個季節只買一件。家居類的頻次就低了,可能一輩子就買一次。不同的類目的需求頻率是不一樣的。 ???? 還有很多不同的點,這里不再贅述。找不同有什么用?當然是算法選擇了,通過上面的2個不同的點,你還會用協同過濾么? ? 二、活用數據,不要被數據綁架! ???? 大家一談到大數據就興奮,數據就是資產,數據就是財富。 ???? 其實,大就是少,越是真實的業務數據,數據量就越大,可用的信息比例就越少,更多的是噪音數據。 ???? 玩大數據和玩實驗室數據有啥不同?夸張點,就是大海撈針和試管捉魚的不同!如果沒有找到適合的信號探測方法,很難找到那根你要的針。 ???? 如果你擬合了噪音數據,那就被數據綁架了,所以不要只看數據,更多地從思考一下業務。 ?????相關與因果 ???? 最近有本書很火,里面提到一個論點,大概意思是:大數據更重視相關,不關心因果。大家不要迷信這些話。我舉幾個例子:1)你如果看數據,手機和手機配件的相關性一定很大,如果一個人買了手機,你推薦手機配件是合理的,但是如果一個人買了手機配件,你去推薦手機就有點弱智了。2)孕婦裝和奶粉的相關性也許很大,但是買了奶粉的人,推孕婦裝就不合適了。所以買了又買的又字不是同時的意思,是條件的意思。 ???? 人的消費行為是有規律的,比如:隨著收入的增加會越來越重視品牌,在人生的不同階段會買不同類目的商品等等;人的消費有心理學現象的,比如:從眾購買,容易受限時秒殺等活動影響等。 ?????信號與噪聲 ???? 信息就像能量一樣,總會衰減,最終退化成毫無意義的噪聲。我昨天點擊了某個品牌,說明可能想買,但是如果是上個月點擊的,和現在會不會買基本上沒有多大關系了。 ???? 對品牌A點擊了1次,對品牌B點擊了10次,是更喜歡品牌B,還是猶豫不決?需要通過數據去分析,要結合其它指標對判定。 ???? 點擊了某個品牌是想買,還是過來看看賣家是否發貨?或者沒到貨前,再品味一下? ???? 所以,真實的業務數據處處都是噪聲。 ???? 活用數據,設計有業務含義的特征體系,是構造魯棒模型的基礎!自我介紹: 算者:ADD大賽內部賽冠軍拓撲隊隊長。阿里巴巴商務智能部數據分析專家。曾就職于中科院自動化所復雜系統與智能科學實驗室、光大銀行總行、百度; 冠軍隊其它成員: 楚蠻:學習于中科院計算所感知課題組,曾就職于雅虎北京研究院,百度等公司,現在在阿里巴巴聚劃算數據挖掘崗位; 小法:曾就職神州數碼、百度、現就職于阿里媽媽事業部,從事項目工程相關工作,平時喜歡打球、dota。
?
轉載于:https://www.cnblogs.com/DjangoBlog/p/3640037.html
總結
以上是生活随笔為你收集整理的转:[大数据竞赛]夺冠感言:走进业务,提升对世界的认知能力的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一只小狗多少钱啊?
- 下一篇: 求一个qq网名伤心的网名