你真的懂用户画像吗?
在移動(dòng)互聯(lián)網(wǎng)時(shí)代,精細(xì)化運(yùn)營(yíng)成為企業(yè)重要的競(jìng)爭(zhēng)力,此時(shí),“用戶畫像”的概念也應(yīng)運(yùn)而生。用戶畫像是指,在大數(shù)據(jù)時(shí)代,我們通過對(duì)海量數(shù)字信息進(jìn)行清洗、聚類、分析,從而將數(shù)據(jù)抽象成標(biāo)簽,利用這些標(biāo)簽將用戶形象具體化,從而為用戶提供有針對(duì)性的服務(wù)。在下文中,我們將以個(gè)推用戶畫像產(chǎn)品為例,為你詳解“用戶畫像”的技術(shù)特點(diǎn)和使用價(jià)值。
個(gè)推用戶畫像產(chǎn)品依托個(gè)推多年積累的海量數(shù)據(jù)及強(qiáng)大的數(shù)據(jù)分析能力,可為APP開發(fā)者提供豐富的用戶畫像數(shù)據(jù)以及實(shí)時(shí)的場(chǎng)景識(shí)別能力,進(jìn)而幫助客戶了解用戶信息,從而助力移動(dòng)APP目標(biāo)用戶精準(zhǔn)篩選、個(gè)性化推送消息和應(yīng)用更新下載等。
用戶畫像的形成需要經(jīng)歷四個(gè)過程,主要包括數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)建模分析、數(shù)據(jù)產(chǎn)出。其中,數(shù)據(jù)清洗和數(shù)據(jù)建模統(tǒng)稱數(shù)據(jù)處理,在經(jīng)過數(shù)據(jù)處理之后,個(gè)推憑借多年積累的大數(shù)據(jù)能力,以獨(dú)特的冷、熱、溫?cái)?shù)據(jù)維度分析進(jìn)行數(shù)據(jù)產(chǎn)出形成用戶畫像。
一、用戶畫像用了哪些技術(shù)?
在數(shù)據(jù)處理階段,個(gè)推用戶畫像產(chǎn)品的大數(shù)據(jù)計(jì)算架構(gòu)采用了Kafka分布式發(fā)布訂閱消息系統(tǒng),這一系統(tǒng)具有高吞吐量、高穩(wěn)定性的特點(diǎn)。數(shù)據(jù)清洗可利用HADOOP、SPARK實(shí)現(xiàn)設(shè)備唯一性識(shí)別、行為數(shù)據(jù)的清洗等,從而去除冗余數(shù)據(jù)。這一過程支持交互計(jì)算和多種復(fù)雜算法,同時(shí),它還支持?jǐn)?shù)據(jù)實(shí)時(shí)/離線計(jì)算。
在數(shù)據(jù)建模的過程中,主要用了機(jī)器學(xué)習(xí)中的聚類(無監(jiān)督學(xué)習(xí))和深度學(xué)習(xí)技術(shù),這能讓模型對(duì)用戶行為數(shù)據(jù)主動(dòng)學(xué)習(xí),進(jìn)行行為判斷,由此產(chǎn)出用戶標(biāo)簽。
之后,數(shù)據(jù)的產(chǎn)出會(huì)形成冷數(shù)據(jù)畫像、溫?cái)?shù)據(jù)回溯、熱數(shù)據(jù)場(chǎng)景和定制化標(biāo)簽四種畫像。
冷數(shù)據(jù)畫像,是指基于大數(shù)據(jù)分析出用戶的屬性,改變概率較小的數(shù)據(jù),如用戶的年齡段、性別等。
“溫?cái)?shù)據(jù)”則可以回溯用戶近期活躍的線上和線下場(chǎng)景,具有一定的時(shí)效性。
“熱數(shù)據(jù)”是指用戶當(dāng)下的場(chǎng)景及實(shí)時(shí)的用戶特征,幫助APP運(yùn)營(yíng)者抓住稍縱即逝的營(yíng)銷機(jī)會(huì)。
定制化標(biāo)簽是將個(gè)推數(shù)據(jù)與第三方數(shù)據(jù)結(jié)合起來,共同建模得出具有價(jià)值的特征標(biāo)簽。總的來說,個(gè)推用戶畫像產(chǎn)品不僅能產(chǎn)出通用的標(biāo)簽維度,也有定制化標(biāo)簽的輸出能力。
二、如何構(gòu)建用戶畫像?
“用戶畫像”的構(gòu)建需要技術(shù)和業(yè)務(wù)人員的共同參與,以避免形式化的用戶畫像,具體做法可參考個(gè)推構(gòu)建用戶畫像的流程:
(1)標(biāo)簽體系設(shè)計(jì)。開發(fā)者需要先了解自身的數(shù)據(jù),確定需要設(shè)計(jì)的標(biāo)簽形式。
(2)基礎(chǔ)數(shù)據(jù)收集、多數(shù)據(jù)源數(shù)據(jù)融合。在建設(shè)用戶畫像時(shí),個(gè)推用戶畫像產(chǎn)品會(huì)整合個(gè)推以及該APP自身的數(shù)據(jù)。
(3)實(shí)現(xiàn)用戶統(tǒng)一標(biāo)識(shí)。多數(shù)情況下,APP的眾多用戶分布于不同的賬號(hào)體系中,個(gè)推會(huì)將其統(tǒng)一標(biāo)識(shí),幫助APP打通賬號(hào),實(shí)現(xiàn)信息快速共享。
(4)用戶畫像特征層構(gòu)建,即將每一個(gè)數(shù)據(jù)進(jìn)行特征化。
(5)畫像標(biāo)簽規(guī)則+算法建模,兩者缺一不可。在實(shí)際的應(yīng)用中,算法難以解決的問題,利用簡(jiǎn)單的規(guī)則也可以達(dá)到很好的效果。
(6)利用算法對(duì)所有用戶打標(biāo)簽。
(7)畫像質(zhì)量監(jiān)控。在實(shí)際的應(yīng)用中,用戶畫像會(huì)產(chǎn)生一定的波動(dòng),為了解決這個(gè)問題,個(gè)推建設(shè)了相應(yīng)的監(jiān)控系統(tǒng),對(duì)畫像的質(zhì)量進(jìn)行監(jiān)控。
總之,個(gè)推用戶畫像構(gòu)建的整體流程,可以概況為三個(gè)部分:
第一,基礎(chǔ)數(shù)據(jù)處理。基礎(chǔ)數(shù)據(jù)包括用戶設(shè)備信息、用戶的線上APP偏好以及線下場(chǎng)景數(shù)據(jù)等。
第二,畫像中間數(shù)據(jù)處理。處理結(jié)果包括線上APP偏好特征和線下場(chǎng)景特征等。
第三,畫像信息表。表中應(yīng)有四種信息:設(shè)備基礎(chǔ)屬性;用戶基礎(chǔ)畫像,包括用戶的性別、年齡段、相關(guān)消費(fèi)水平等;用戶興趣畫像,即用戶更有興趣的方向,比如用戶更偏好拼團(tuán)還是海淘;用戶其它畫像等。
在個(gè)推用戶畫像構(gòu)建的過程中,機(jī)器學(xué)習(xí)占據(jù)了較為重要的位置。機(jī)器學(xué)習(xí)主要應(yīng)用在海量設(shè)備數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)的過程。
三、用戶畫像能做什么?
用戶畫像常用在電商、新聞資訊等APP,幫助APP打造內(nèi)容精準(zhǔn)推薦系統(tǒng),實(shí)現(xiàn)千人千面運(yùn)營(yíng)。
基于用戶特征的個(gè)性化推薦
APP的運(yùn)營(yíng)者通過個(gè)推用戶畫像提供的性別、年齡段、興趣愛好等標(biāo)簽,分別展示不同的內(nèi)容給用戶,以達(dá)到精準(zhǔn)化運(yùn)營(yíng)。
基于用戶特征指導(dǎo)內(nèi)容推薦
基于用戶特征指導(dǎo)內(nèi)容的推薦是指找到與目標(biāo)相似的用戶群,利用該用戶群的行為特征對(duì)目標(biāo)用戶進(jìn)行內(nèi)容推薦,具體過程如下圖:
在這里,我們需要解釋一下其中所涉及到的相似性建模技術(shù)。相似性建模可類比于聚類建模,它是無監(jiān)督學(xué)習(xí)中的一種,它指的是尋找數(shù)據(jù)中的特征,把具有相同特征的數(shù)據(jù)聚集在一組,賦予這些聚集在一起的數(shù)據(jù)相同的特征標(biāo)簽,從而給這些具有這些特性的用戶推送相同的內(nèi)容。
這種推薦方式的優(yōu)點(diǎn)是,它的自有特征是經(jīng)過APP長(zhǎng)期積淀而來,顆粒度更細(xì),適用性更強(qiáng),對(duì)用戶的認(rèn)識(shí)更全面,效果能持續(xù)提升,而且它還能針對(duì)APP所處行業(yè)與自身需求,量身定制匹配算法,讓推薦更精準(zhǔn)。
此外,如上文所言,個(gè)推用戶畫像能夠結(jié)合第三方數(shù)據(jù)做定制化建模,通過雙方共同建模得出顯著價(jià)值和特征標(biāo)簽,依據(jù)不同標(biāo)簽向用戶推送不同的內(nèi)容。這樣不僅能保證推送的內(nèi)容更精準(zhǔn),覆蓋面也更廣泛,而且標(biāo)簽增補(bǔ)的方式,也可以很大程度上提升流量?jī)r(jià)值。
四、開發(fā)者如何接入?
個(gè)推用戶畫像SDK的接入主要有兩個(gè)方式:
- SDK集成:客戶端集成個(gè)推用戶畫像SDK,進(jìn)行初始化SDK后,返回給客戶一個(gè)ID即GIUID(唯一身份標(biāo)識(shí)), 此ID需要由客戶端提交到客戶服務(wù)器,然后服務(wù)器通過API接口傳入GIUID進(jìn)行查詢用戶畫像標(biāo)簽數(shù)據(jù)。
- API接口調(diào)用:客戶將應(yīng)用名稱、包名及服務(wù)端出口IP提供后,返回APP ID等相關(guān)信息。客戶根據(jù)《個(gè)推用戶畫像數(shù)據(jù)服務(wù)接口文檔》及《用戶畫像編碼表》集成測(cè)試后方可調(diào)用API接口查詢畫像信息。
具體的集成文檔參見以下鏈接:
Android:http://docs.getui.com/gexiang/start/android/
iOS:http://docs.getui.com/gexiang/start/ios/
服務(wù)端:http://docs.getui.com/gexiang/start/server/
總結(jié)
以上是生活随笔為你收集整理的你真的懂用户画像吗?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在linux服务器上使用hanlp
- 下一篇: 我对RPC的理解