神策数据成林松:数据智能在业务场景下的应用(附 PPT 下载)
?
?在神策 2020 數(shù)據(jù)驅(qū)動用戶大會「上海站」現(xiàn)場,神策數(shù)據(jù)業(yè)務(wù)咨詢師成林松分享了《數(shù)據(jù)智能在業(yè)務(wù)場景下的應(yīng)用》的演講。(文末附 PPT 下載地址)
本文根據(jù)其演講內(nèi)容整理,數(shù)據(jù)均為虛擬。主要內(nèi)容如下:
· 數(shù)據(jù)智能的概念與重要性
· 業(yè)務(wù)經(jīng)營視角下數(shù)據(jù)智能的典型應(yīng)用場景
· 數(shù)據(jù)智能的實現(xiàn)過程和落地實踐:以「推薦」為例
· 神策如何助力企業(yè)探索數(shù)據(jù)智能
數(shù)據(jù)智能的概念與重要性
關(guān)于數(shù)據(jù)智能,我們首先要了解什么叫數(shù)據(jù)智能?“數(shù)據(jù)智能指基于大數(shù)據(jù)引擎,通過大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù),對海量數(shù)據(jù)進(jìn)行處理、分析和挖掘,提取數(shù)據(jù)中所包含的有價值的信息和知識,使數(shù)據(jù)‘智能’,并通過建立模型尋求現(xiàn)有問題的解決方案以及實現(xiàn)預(yù)測等。”
從消費(fèi)者的角度來看,數(shù)據(jù)智能的應(yīng)用場景已經(jīng)覆蓋生活的方方面面,比如家門口的紅綠燈,基于“城市大腦”數(shù)據(jù)制度,紅燈跳轉(zhuǎn)時間經(jīng)常調(diào)整,雖然實際的應(yīng)用效果可能會導(dǎo)致交通擁堵,但這也從某種角度驗證了數(shù)據(jù)智能已被廣泛應(yīng)用。
從企業(yè)經(jīng)營角度來看,數(shù)據(jù)智能的實際應(yīng)用場景包括個性化推薦、相關(guān)數(shù)據(jù)分析等,其在企業(yè)的初步應(yīng)用目的即幫助企業(yè)提升經(jīng)營效率和精細(xì)化運(yùn)營。
那么,為什么會有越來越多的人和企業(yè)開始關(guān)注數(shù)據(jù)智能?我們可以從供給和需求兩方面深入了解。??在數(shù)據(jù)智能的供給端,其大規(guī)模的商業(yè)化要求其具備核心的基礎(chǔ)能力,這些能力可以像齒輪一樣轉(zhuǎn)動促使數(shù)據(jù)智能的商業(yè)化:第一,模型,很多經(jīng)典的計算模型在十幾年前甚至更早以前就提出來了;第二,計算性能,但部分模型受制于計算的性能,未能得到較好發(fā)展;第三,數(shù)據(jù)的豐富度,它是決定數(shù)據(jù)智能能否做好的重要因素,這也是近些年各大企業(yè)紛紛重視數(shù)據(jù)、注重行為數(shù)據(jù)采集的原因。
在需求端,首先要從商業(yè)競爭的核心目的——提升經(jīng)營水平出發(fā)。在存量競爭時代,我們更多的將注意力放在挖掘老用戶價值上,會關(guān)注其 ARPU(每用戶平均收入)值。比如某咖啡品牌考慮在咖啡售賣之外,擴(kuò)充品類,加入輕食套餐的銷售等,這是基于企業(yè)戰(zhàn)略的考慮,而提升 ARPU 值的核心解決方案是「個性化」,如果面向每一個用戶提供的產(chǎn)品都是根據(jù)其偏好定制的,那么轉(zhuǎn)化率必然會得到巨大提升。但是如何實現(xiàn)個性化?純粹靠人力給每一個用戶打標(biāo)簽是不現(xiàn)實的,這個時候就需要數(shù)據(jù)智能來幫助企業(yè)實現(xiàn)「個性化」。
業(yè)務(wù)經(jīng)營視角下數(shù)據(jù)智能的典型應(yīng)用場景
我將數(shù)據(jù)智能的典型應(yīng)用場景分為以下幾類,如下圖所示:?
第一,助力業(yè)務(wù)分析,輔助產(chǎn)生業(yè)務(wù)洞察。
作為分析師,經(jīng)常關(guān)注指標(biāo)的異動,對用戶和人群的認(rèn)知,定位某個/些功能對特定用戶產(chǎn)生的行為具有因果關(guān)系,以及數(shù)據(jù)維度下降等,以此發(fā)揮數(shù)據(jù)的價值。
1.指標(biāo)的應(yīng)用分析
在分析層面,我們經(jīng)常做指標(biāo)的應(yīng)用分析,在某些特定場景下,分析師的一些分析思路其實可以按照特定規(guī)律固定下來,比如 A 企業(yè)的業(yè)務(wù)較穩(wěn)定,管理者關(guān)注的是與銷售額相關(guān)指標(biāo)的異動,那么就需要采用不同的分析思路,對其指標(biāo)的異動做相應(yīng)分析。一方面可以做維度的下鉆,通過地域、門店、品類等多維度進(jìn)行分析,挖掘該異動是由于某一維度導(dǎo)致還是全局變化引發(fā)的;另一方面,也可以從相關(guān)的因子角度去拆解該指標(biāo),分成流量、轉(zhuǎn)化率等,最終得到指標(biāo)異動的原因。
針對此,我們完全可以通過規(guī)則建立、模型等方式來實現(xiàn)業(yè)務(wù)分析,節(jié)省分析師的投入,并且如果發(fā)現(xiàn)指標(biāo)異動,還可以通過數(shù)據(jù)產(chǎn)品自動給出解釋。
2.人群的需求分析
有些產(chǎn)品到了一定階段其用戶可能會達(dá)到幾十萬、幾百萬甚至更多,但是用戶都有哪些類型,分別有什么樣的需求?這對分析師來說是一個“迷人”的話題。
1)基于決策樹,洞悉用戶留存
下圖是神策為某短視頻企業(yè)做的新增用戶的需求分類,采用「決策樹」的方式,以次日留存為目標(biāo)進(jìn)行分類,用于分類的標(biāo)簽包括“核心功能的使用次數(shù)”等。??通過分析發(fā)現(xiàn),“高播放互動型”用戶在平臺上操作“播放”的頻率較高,同時也會在評論留言區(qū)多次活躍,我們可以判斷此類用戶是將該平臺作為“興趣社交”使用;“高播放消費(fèi)型”用戶則是“播放”較多“互動”較少,屬于內(nèi)容消費(fèi)型用戶;而還有一類用戶明顯地把該平臺作為視頻拍攝與發(fā)布的工具,那么就可以猜測該用戶背后是一個短視頻運(yùn)營機(jī)構(gòu)等。
2)基于用戶行為探查用戶需求
下圖為神策數(shù)據(jù)基于 KMIS 為某航空 APP 的新增用戶做的聚類。??基于新增用戶行為數(shù)據(jù)分析,我們可以發(fā)現(xiàn),在“用戶新增場景”中占比較高的是基于“工具需求”,同時用戶在使用 APP 的過程中,高頻率使用的功能為“值機(jī)”,結(jié)合神策過往合作經(jīng)驗,大部分航空 APP 被多次使用的功能均為“值機(jī)”,因為多數(shù)用戶的“預(yù)訂”動作都會選擇在 OTA (在線旅游)進(jìn)行,因此對航空 APP 的更多需求在于預(yù)訂之后的“查詢”、“值機(jī)”等;而對于“黃牛類型”用戶來說,他們更多的在 APP 上操作“領(lǐng)券”的動作。
3)特定功能對用戶的留存影響
對于做內(nèi)容的產(chǎn)品,經(jīng)常需要考量的問題是“什么樣的功能能夠?qū)τ脩舻牧舸娈a(chǎn)生影響”。下圖為某內(nèi)容社區(qū)平臺,通過在評論區(qū)展示高質(zhì)量的核心內(nèi)容,并提高該評論內(nèi)容的曝光,讓用戶更快、更近距離地感受平臺價值,以此驅(qū)動用戶留存。??該分析思路也可以進(jìn)一步孵化:通過數(shù)據(jù)分析及運(yùn)營工具基于相關(guān)的計算規(guī)則,將評論、內(nèi)容等進(jìn)行排序,以用戶行為分析結(jié)果決定內(nèi)容排序,然后再去思考背后的因果關(guān)系,進(jìn)而促進(jìn)產(chǎn)品的優(yōu)化。
4)數(shù)據(jù)降維定位核心問題所在
很多情況下,用戶的評論、反饋等內(nèi)容多而雜,逐條去看耗時耗力,這個時候我們就可以通過特定的模型,對內(nèi)容進(jìn)行維度下降,聚類出幾類典型結(jié)果,幫助我們定位核心問題所在。
這種方式通常用于文本分析、報錯等場景中。
第二,精細(xì)化運(yùn)營。
在此過程中,很重要的一個動作是識別用戶各個階段的標(biāo)簽,并預(yù)測用戶是否會流失,是否對某個產(chǎn)品感興趣等,然后針對性地面向用戶做精細(xì)化運(yùn)營。
大多數(shù)情況下,我們會根據(jù)興趣標(biāo)簽進(jìn)行個性化推薦,如手機(jī)平臺根據(jù)用戶的興趣愛好針對性地推薦 APP;根據(jù)業(yè)務(wù)標(biāo)簽預(yù)測運(yùn)營風(fēng)險、做 RFM 運(yùn)營,如金融產(chǎn)品根據(jù)用戶收入、職業(yè)穩(wěn)定性等標(biāo)簽來判斷用戶是否會逾期等;根據(jù)流失預(yù)測結(jié)果對用戶做全生命周期運(yùn)營,在用戶流失之前介入,而不是在流失后進(jìn)行召回。
第三,助力個性化體驗提升。
即人和商品的匹配效率,千人千面。
個性化推薦常用于電商場景,核心目的在于提升用戶和商品的匹配效率,最終服務(wù)于用戶粘性和轉(zhuǎn)化率的提升。當(dāng)內(nèi)容、商品逐漸豐富之后,如何讓每一個用戶快速看到自己想要的內(nèi)容或商品,「個性化推薦」完美解決了這個問題。
第四,數(shù)據(jù)與產(chǎn)品結(jié)合,助力產(chǎn)品附加值提升。
比如,通過對照片、文本、音樂等做內(nèi)容聚類,形成特定內(nèi)容的推薦。
在我們的手機(jī)相冊中,可以通過圖像識別形成一定的標(biāo)簽,可能是地點、人物等,基于數(shù)據(jù)分析做圖片的聚類,進(jìn)而和用戶之間產(chǎn)生高度粘性;在音樂類型產(chǎn)品中,如果基于歌曲的相關(guān)性,自動給用戶推薦歌單,那么用戶使用效率會大大提升,用戶對產(chǎn)品的信任和忠誠度也會隨之增強(qiáng)。
從以上數(shù)據(jù)智能的應(yīng)用場景中,我們可以概括成一句話:在很多情況下,數(shù)據(jù)智能已不局限于“錦上添花”,逐漸變成了企業(yè)能否高效率運(yùn)行、在市場競爭中勝出的關(guān)鍵因素。
數(shù)據(jù)智能的實現(xiàn)過程和落地實踐:以「推薦」為例
現(xiàn)階段,「推薦」已經(jīng)發(fā)展成為一個比較成熟的應(yīng)用場景,通過行為數(shù)據(jù)建立集市,根據(jù)特征挖掘引入行為特征,然后在模型訓(xùn)練中得到業(yè)務(wù)指標(biāo)的預(yù)測,最后把根據(jù)每個用戶特征生成的個性化列表傳到用戶端。??接下來我們一起了解一下在此過程中的核心注意事項。
1.理解業(yè)務(wù)是實現(xiàn)數(shù)據(jù)智能過程中最基本的環(huán)節(jié)
我們可以通過兩個不同類型的產(chǎn)品做輔助理解。
1)母嬰行業(yè)屬于典型的全生命周期運(yùn)營模式,備孕、孕期、寶媽和寶寶在不同階段關(guān)注的內(nèi)容和產(chǎn)品是完全不同的,母嬰內(nèi)容社區(qū)平臺可基于后臺數(shù)據(jù)分析、機(jī)器學(xué)習(xí)完成規(guī)模推薦,將會在很大程度上提升用戶運(yùn)營效率,實現(xiàn)精準(zhǔn)觸達(dá)。因此,理解業(yè)務(wù)包含對產(chǎn)品形態(tài)、具體場景等的理解。
2)影視領(lǐng)域的推薦參考指標(biāo)通常為“用戶點擊視頻”,但在新用戶階段,可參考的數(shù)據(jù)樣本較少,沒有完整的樣本供模型訓(xùn)練。此時,通過深入了解產(chǎn)品的使用過程,就會發(fā)現(xiàn)在各個類目推薦的時候,用戶滑動視頻的動作其實代表了用戶當(dāng)前的興趣特征,如果把它引入到新用戶冷啟動的模型中,就能夠產(chǎn)生較好的推薦效果。也就是說,要精準(zhǔn)定位用戶的典型特征,作為模型計算的參考。
2.基于目標(biāo),選擇合適的模型
在推薦的過程中,我們常用的模型包括:決策樹、KMIS、線性回歸等。當(dāng)我們需要分析用戶的使用健康度、分析用戶的使用頻次等,采用線性回歸方式即可。也就是說要根據(jù)目標(biāo)場景選擇合適的模型。
3.發(fā)揮行為數(shù)據(jù)的價值
選擇了合適的模型之后,要將用戶的部分關(guān)鍵行為作為用戶特征。
如下圖左側(cè),在某地圖產(chǎn)品中,當(dāng)用戶在搜索框輸入了部分文字,系統(tǒng)會自動預(yù)測用戶要搜索什么地方,幫助用戶快速定位目的地,成功完成推薦;但同時,某些情況下會產(chǎn)生“誤點擊數(shù)據(jù)”,即系統(tǒng)推薦給用戶的內(nèi)容并非用戶目的地,用戶“誤點擊”之后產(chǎn)生的數(shù)據(jù)為“無效數(shù)據(jù)”,即純粹用“點擊行為”做模型學(xué)習(xí)的話會產(chǎn)生無效樣本。那么,這個時候,神策的會話功能就可以被引入到整個樣本的篩選過程中,基于用戶最終的目的地,關(guān)聯(lián)其前面步驟中的“輸入”與“點擊行為”,就可以有效解決“無效點擊”的問題。在這個過程中,行為前后的序列通常都是很重要的特征,要重點關(guān)注。??如上圖右側(cè)所示,深度學(xué)習(xí)在智能推薦過程中使用較多,其最重要的特點是建模用戶行為的時序特征,此時模型就會把它當(dāng)做訓(xùn)練的重要考慮點,同時保證用戶精準(zhǔn)識別,行為序列的時間戳記錄不能混亂。
4.效果評估,多指標(biāo)學(xué)習(xí)
就「推薦」來說,我們經(jīng)常會建立一定的指標(biāo)去訓(xùn)練模型,具體指標(biāo)包含點擊率、轉(zhuǎn)化率等,同時做多維度劃分洞察新用戶的轉(zhuǎn)化,其核心在于選擇什么樣的目標(biāo)。
我們可以參考某視頻平臺的場景:視頻前后的廣告推薦應(yīng)該以什么為核心指標(biāo)?如果以“人均點擊次數(shù)”為核心指標(biāo),會導(dǎo)致“標(biāo)題黨”內(nèi)容,這個時候有兩種選擇,第一,設(shè)計相對應(yīng)的解決策略,第二,評估指標(biāo)選擇是否正確,如果評估指標(biāo)為“視頻播放時長”,那么得到的分析結(jié)果相對質(zhì)量會更高。這就是指標(biāo)選擇的重要體現(xiàn)。
5.優(yōu)化效果,數(shù)據(jù)分析助力
「推薦」上線后,仍有很長的分析迭代過程,在這個過程中,數(shù)據(jù)分析能力是算法工程師很重要的一個能力。
下圖是為某款陌生人社交產(chǎn)品的推薦調(diào)優(yōu)過程,其核心功能是「匹配」。??在匹配人率(成功匹配人數(shù)/點擊喜歡的人數(shù))方面,神策得出的數(shù)據(jù)值低于客戶自建。這個時候,需要通過業(yè)務(wù)指標(biāo)的拆解,尋求數(shù)值不一致的原因。
經(jīng)過指標(biāo)變形,我們得到這樣一個公式:匹配人率 = 回關(guān)率 * 人均點擊喜歡次數(shù) * 匹配覆蓋度。“回關(guān)”指的是用戶點擊“喜歡”后,得到的對方“喜歡”的次數(shù)。通過對比發(fā)現(xiàn),在其業(yè)務(wù)形態(tài)中,神策是以“點擊喜歡”作為核心指標(biāo)進(jìn)行計算,這就導(dǎo)致了大批量的優(yōu)質(zhì)用戶因為其回關(guān)門檻較高,導(dǎo)致了回關(guān)率低、匹配人率低。通過以上洞察,神策數(shù)據(jù)及時調(diào)整召回模型的參數(shù),以“匹配成功”為訓(xùn)練參數(shù),得到的匹配人率遠(yuǎn)高于客戶自建。
在這整個過程中,我們基于數(shù)據(jù)分析發(fā)現(xiàn)結(jié)論,以此驅(qū)動數(shù)據(jù)智能產(chǎn)品的優(yōu)化。
6.產(chǎn)品層面持續(xù)改進(jìn)
算法和模型不是萬能的,當(dāng)選擇了模型、特征之后,在產(chǎn)品的 CPR 值達(dá)到了較高階段的時候,我們的業(yè)務(wù)指標(biāo)不僅僅要通過算法的形式去實現(xiàn),還要結(jié)合產(chǎn)品層面來持續(xù)改進(jìn)。
比如,當(dāng)用戶通過 APP 搜索美食,除了可以推薦給用戶飯店名稱,我們還可以通過知識圖譜的學(xué)習(xí)給出推薦理由,為什么這家飯店排行第一等,有助于用戶理解排序結(jié)果,并引導(dǎo)用戶深入查看。 在產(chǎn)品外形方面,雖然個性化推薦的效果較好,但曝光較低,這是因為大多情況下,個性化推薦欄目往往在產(chǎn)品形態(tài)里較弱的位置,這個時候就需要對產(chǎn)品流量分發(fā)層面進(jìn)行改進(jìn),把更多的內(nèi)容在產(chǎn)品外層直接曝光,提升平臺的可能性。
在個性化海報方面,因為每個人的關(guān)注點不同,所以可以借助機(jī)器化形成個性化海報展示給用戶,以此提升 CTR。
神策如何助力企業(yè)探索數(shù)據(jù)智能
在服務(wù)了 1500+ 企業(yè)之后,神策發(fā)現(xiàn)數(shù)據(jù)智能的關(guān)注者更多的還是企業(yè)內(nèi)部的技術(shù)人員,對業(yè)務(wù)發(fā)展的影響有限。究其原因,主要有以下三點:
1.數(shù)據(jù)質(zhì)量不夠高,導(dǎo)致智能推薦的結(jié)果和預(yù)測結(jié)果都不準(zhǔn)確,無法為業(yè)務(wù)提供參考。
2.技術(shù)人力投入較低,對于整個行業(yè)來說,大部分模型的持續(xù)引進(jìn)都依賴于頭部公司的不斷迭代,相對來說,中小企業(yè)在這方面缺乏長期的積累。
3.業(yè)務(wù)部門的參與有限。業(yè)務(wù)部門對數(shù)據(jù)智能的關(guān)注度低,導(dǎo)致數(shù)據(jù)智能無法應(yīng)用到實際業(yè)務(wù)過程中。
?基于以上三大痛點,神策發(fā)揮的作用是什么呢?
首先,對于數(shù)據(jù)質(zhì)量,神策堅持“給客戶帶來價值”的工作原則,通過多種方式幫助客戶提升數(shù)據(jù)質(zhì)量。比如,多端數(shù)據(jù)打通,用戶關(guān)聯(lián)支持多對一、多對多,數(shù)據(jù)接入過程中強(qiáng)校驗,專門的數(shù)據(jù)治理,把控交付質(zhì)量,形成管理規(guī)范等。
其次,產(chǎn)品化,神策已形成規(guī)模化的產(chǎn)品矩陣,包括神策分析、神策智能運(yùn)營、神策智能推薦、神策用戶畫像、神策客景,功能涵蓋基礎(chǔ)的數(shù)據(jù)分析、打標(biāo)簽、健康預(yù)測、指標(biāo)預(yù)測、個性化推薦等等。
其中,對于神策智能推薦,我們不僅希望帶給客戶一次性計算,更多地希望能夠形成一個可交付的產(chǎn)品,我們可以看到整個推薦模型的運(yùn)轉(zhuǎn)過程,也可以保證一定的開放性,就是說我們業(yè)務(wù)人員可以對此展開洞察、調(diào)用,賦能業(yè)務(wù)實踐,提升整體的推薦效果。??每個用戶對于特定的業(yè)務(wù)場景,其模型訓(xùn)練標(biāo)簽都是一個單獨(dú)的過程。如果我們想要將其規(guī)模化,需要抽象出各個模型預(yù)測標(biāo)簽,以此預(yù)測該用戶接下來的業(yè)務(wù)表現(xiàn)。這也是神策用戶畫像在做的一件事情。
比如,某產(chǎn)品要預(yù)測用戶接下來會不會購買該產(chǎn)品的會員服務(wù)。首先選定目標(biāo)用戶,可能是此前購買過但已流失的用戶,也有可能是從未觸達(dá)到的用戶,但整體需要基于“決定性”特征去完成篩選,比如用戶的屬性,做過什么樣的行為等,然后通過機(jī)器學(xué)習(xí)的方式為有可能購買會員服務(wù)的用戶打上“業(yè)務(wù)轉(zhuǎn)化”的預(yù)測標(biāo)簽。除此之外,在渠道投放上也同樣適用。
最后,以數(shù)據(jù)智能驅(qū)動業(yè)務(wù)發(fā)揮價值。對于智能產(chǎn)品的交付,以「推薦」為例,我們不僅交付推薦的結(jié)果,而且以業(yè)務(wù)目標(biāo)為導(dǎo)向,在最初的需求調(diào)研階段,我們會主動跟客戶溝通應(yīng)該關(guān)注的業(yè)務(wù)指標(biāo),并以指標(biāo)的提升作為交付目標(biāo)。??以上為本次演講全部內(nèi)容,感謝大家的聆聽!?
總結(jié)
以上是生活随笔為你收集整理的神策数据成林松:数据智能在业务场景下的应用(附 PPT 下载)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 八城联动 丨 神策 2020 数据驱动用
- 下一篇: 【杭州站参会指南】神策 2020 数据驱