用户标签体系的设计和效果评估
導讀:隨著互聯網流量逐漸見頂,傳統的粗狂式的買量獲客沖業績很快會成為業務發展的瓶頸。對于中大型互聯網公司來說,精細化的運營和精準化營銷是企業運營老戶,發揮存量用戶最大價值的必經之路。新的流量洼地越來越少,企業一方面要做到精準獲客,另一方面也要使出渾身解數提升用戶留存,最大化挖掘用戶價值。運營的精準化需要海量數據來支撐,而建設一個數據中臺恰恰是重中之重,其中用戶標簽體系又是數據中臺建設的基礎能力和關鍵設施。
什么是用戶標簽體系 ?
用戶標簽是構成用戶畫像的核心因素,是將用戶在平臺內所產生的業務數據,行為數據,日志數據等分析提煉后生成具有差異性特征的形容詞。即用戶通過平臺,在什么時間什么場景下做了什么行為,平臺將用戶所有行為數據提煉出來形成支撐業務實現的可視化信息。
用戶標簽可以有很多種存在形式,可以是用戶的自然屬性,可以是對用戶交易、資產數據的統計指標,也可以是基于某些規則,總結出的一些分層。無論是哪種形式,都是對用戶的某個維度特征做描述與刻畫,讓使用者能快速獲取信息。
個人認為,好的標簽需要具備如下四點特征:
原子性。即用戶標簽是用戶畫像特征刻畫的最細粒度。
可復用性。標簽可以被多次使用,而非一次性標簽
可度量性。標簽值和價值可被度量和計算。
可組合性。標簽可被自由組合生成組合標簽。
用戶標簽有哪些分類?
標簽有多種分類方式。
1. 從更新頻率來分:靜態標簽、動態標簽
例如“性別”這個標簽,一般來說是不會隨著時間變動的,所以它屬于靜態標簽;而“最近一次訪問時間”會隨著每次用戶登錄而更新,也就是動態標簽。
2. 從開發方式分:事實標簽、規則標簽、預測標簽
這一種分類方式是從技術開發角度區分的。
“事實標簽”是從底層數據表中取出原始數據,進行簡單的加減乘除運算得到的標簽;例如“最近一次登錄距今天數”這個標簽,它反映基本事實。
“規則標簽”則是進行了業務定義后的標簽;例如“流失用戶”這個標簽,基于我們的業務認知,可以將“最近一次登錄距今天數”大于30天的用戶定義為流失用戶,不同公司會有自己的定義方式。
?“預測標簽”是需要利用算法分析預測才能得到的標簽了;例如電商產品常通過用戶的下單行為,去猜測用戶的性別;通常算法類標簽涉及復雜的邏輯與權重,開發難度大,在所有標簽中占比不高。
3. 從生成規則分:單一標簽、復合標簽
一般來說,上述的統計類標簽可以說是單一標簽,而規則類和算法類標簽就是需要多個單一標簽組合而成的復合標簽
4. 從層級上分:一級標簽、二級標簽、三級標簽等
同樣,層級也是為了業務理解更加有序才產生的,例如一級標簽是大類,按具體行業和業務可以分為:人口屬性,行為屬性,營銷屬性,商業屬性等。二級標簽可以具體下分,比如商業屬性下二級標簽可以分為優惠券,三級標簽分為優惠券-敏感度高/中/低用戶。當然,如果業務邏輯復雜,可能還會有三級標簽。
為什么要建設用戶標簽體系?
以作者多年從業經歷來看,一般的中大型公司或多或少都已經有建設自己的標簽,但實際使用效果卻差強人意,很難驅動業務產生價值。我總結出互聯網行業搭建統一的用戶標簽體系要解決的常見痛點:
1.??標簽口徑不一致
用戶畫像、精準營銷平臺人群圈選、算法特征都會涉及到用戶標簽,各個系統存在標簽同義不同值、同值不同義的問題,舉個例子:互金信貸行業的通過率,就有至少三種不同的統計口徑,風控部門是以授信通過或者審核通過為準,財務部門以放款為準等。不同部門因側重點不一樣導致對這個指標的定義不一樣。企業建設統一的標簽平臺規范口徑也是數據中臺的重要內容。
2.??標簽指標重復建設
用戶標簽分散,重復建設,難以統一管理。形成了局部數據孤島,存在重復建設的問題。
比如和標簽生產相關的團隊就有好幾個:數據團隊模型開發人員要做自己的模型變量標簽,存在多個模型工程師重復建設同一標簽而產生大量同質的標簽表;數據分析團隊歸納業務需求總結出來的標簽,比如用戶生命周期標簽,若分析團隊位于不同部門則重復建設情況更為嚴重,再加上技術開發同學做的營銷平臺,消息系統,優惠券平臺等需要打常規的用戶標簽來選人等等。
3.??標簽生產周期長
互聯網公司的標簽生產流程大抵如下:
業務提標簽需求—>數據對接人(一般是數據PM or 分析師)收集轉化—> 提交給數據開發(離線開發與實時開發) —> 數據開發按業務邏輯清洗數據,導入平臺系統—> 后臺開發 做成數據服務統一對外輸出標簽。
一般如果沒有做標簽上線流程的配置化,此時還需要前端開發介入,整個流程耗時長,平均需求產生到上線耗時一周以上甚至更長時間,和同行朋友聊,有些國有企業生產常規運營標簽耗時竟然可以達到1個月,這樣的生產流程根本無法滿足業務快速發展的需求
4.??業務運營靠經驗,手工操作流程多周期長
在缺乏統一標簽平臺或者沒有精準圈人平臺之前,以信貸行業為例,一般運營同學做活動的流程如下:
活動前:運營提選人需求->分析師提數—>風控人員規則過濾用戶—> 運營手動分組
運營將名單導入到營銷系統 —> 選擇觸達方式(消息/優惠券等)和觸達周期(一次性/周期性/實時等) -> 觸達用戶
活動后:運營將名單再次給分析師 —> 分析師提數給運營—> 運營分析活動效果
這里面存在很多拍腦袋決策的節點,比如運營圈人規則看不到人群數量,容易出現圈定人群樣本量過少無法進行營銷活動;運營在看不到人群畫像和分布的情況下,手動盲目對人群進行分組AB Test,容易導致AB Test結論不可靠。活動效果分析沒有橫向和縱向對比,無法客觀得出活動到底做的怎么樣。當然這里面還存在諸多手工操作的地方和維護困難的地方,比如每次圈人過風控規則,圈人后手工導入營銷系統,手動將名單到給分析師提數做效果分析等。
基于以上種種痛點,那如何建設一個統一可用的用戶標簽體系呢?
如何設計用戶標簽體系?
核心原則:從業務中來,到業務中去;以終為始,怎么用來倒推怎么設計
任何脫離業務自造的標簽都是自嗨,這也是很多大公司數據部門容易犯的錯,數據部門想要從數據層面去驅動業務,基于自身過往從業經驗,拍腦袋梳理和設計了上百個標簽,卻發現業務根本不買單。數據部門價值體現的唯一方式就是融入業務團隊,知道業務來龍去脈和痛點。總結下來正確的順序是明確商業目的,梳理業務流程,收集業務痛點,匯集整理標簽,最后才是開發標簽反哺業務。基于作者多年經驗,如何設計標簽可以歸納為以下兩種方法:
方法一:基于業務主流程來設計標簽
以信貸行業為例,梳理后信貸業務主流程如下:
激活 —>注冊—>登錄—>認證—>申請進件—>風控—>放款—>還款—> 逾期催收
以激活到注冊流程為例,為精準化識別用戶渠道及后續做渠道成本結構優化,我們這個環節可能需要的標簽是注冊渠道,獲客渠道,渠道類型,結算類型,獲客成本,注冊設備等
再以申請進件到風控流程為例,結合流程中常見的業務場景,可能需要的標簽:首次/最近一次申請時間/產品/額度/是否通過,總申請次數/金額,拒絕次數/放棄次數,通過類型(人工/系統自動)等
方法二:基于業務場景來設計標簽
以典型運營場景為例,信貸業務主要靠老戶復貸掙錢,促老戶復貸是經常會做的一個運營活動,思考活動運營的三個要素(活動對象,在什么場景,執行什么策略),我們需要的標簽可能是用戶類型(新老戶),最近一次成功還款時間/金額,最近一次借款產品,產品偏好,優惠券敏感度/響應度,額度敏感度/響應度 等等
方法三:基于北極星指標自頂向下設計標簽
一般公司每年會基于大的戰略方向制定公司整體的北極星指標(指引業務發展的指標),然后基于整體業務指標自頂向下拆分到各業務部門,各業務部門再根據運營策略拆解成更細的指標。
舉個例子,某信貸公司制定當年度北極星指標為:利潤,注冊量,放款量,逾期率。其中利潤為主指標,其他三個指標圍繞利潤指標進行平衡。想提升利潤核心是提升放款量,但提升放款量會帶來獲客成本上升以及壞賬成本上升,所以這是三者的平衡。
我們先來拆解下利潤指標:
利潤 = 收入 – 成本
收入 = 放款人數 * 人均放款金額 ?*? 收益率
成本 = 獲客成本 + 壞賬成本
提升放款人數:常見的運營手段 有低成本獲客,優化各環節轉化率,提升借款通過率,涉及到的標簽類別是?獲客場景標簽,各節點是否完成轉化標簽,借款行為場景標簽等
提升人均放款金額:需要配合做用戶運營,比如單期轉分期,短期轉長期,優質用戶提額,促進老用戶復借等,涉及到是單期/累計 借款金額/筆數/最近一筆距今時長,用戶產品偏好,用戶資質,用戶等級,續貸間隔,續貸次數,用戶生命周期等標簽等
下面我們看看成本指標,信貸公司最大的成本在于兩塊:獲客成本和壞賬成本
降低獲客成本:本質上需要接入更多優質渠道以及優化CPA/CPS結算的轉化率,基于此這里涉及到的標簽是 注冊時間,注冊渠道,獲客渠道,渠道類型,結算類型,獲客成本,注冊設備等
降低壞賬:本質上是對逾期用戶進行管理,需要很多貸款信息標簽和逾期信息標簽,比如累計逾期金額,累計逾期筆數,最近一次逾期時間,最長逾期時間等等
此外,設計一個好的用戶標簽平臺還需要考慮如下特征:
1.???數據和業務團隊雙贏策略— 標簽生成自助化
讓使用方自助生成標簽是數據團隊和業務團隊雙贏的策略,即提高了業務團隊運營的效率,解決了標簽的業務字段邏輯溝通的成本,同時釋放了數據團隊開發標簽維護標簽的工作。標簽生成自助化前期開發成本較高,適用于在中期上線第一版后再來落地。具體如何設計自助化打標功能,可以在后續文章中逐一分享。
2.???標簽系統價值的可持續性— 建立有效的標簽管理維護機制
標簽的維護包括標簽規則及元信息維護,標簽生產調度機制及信息同步,有統一的輸出接口。
這是持續釋放用戶標簽平臺的重要步驟,也是容易被忽視的環節。
3.???標簽平臺的運營
標簽平臺是數據產品,既然是產品就需要做運營,讓我們的用戶更好更高效的使用起來。及時關注用戶反饋,經常做一些運營手段來觸發用戶,讓產品和用戶交互起來。這里引申出一個更大的話題:如何做數據產品的運營?這個話題后續再逐步分享。
如何評估用戶標簽體系的效果 ?
為什么要進行標簽效果評估?
對標簽的質量進行科學完整地評估,有助于控制標簽質量,指導標簽的管理者、開發者不斷地提升標簽質量。通過創建一套完整的評估體系,對于質量過差的標簽,可以考慮不進行上線,等達到基本的質量要求后才能開放給業務使用。不然,既對業務帶來不了價值,也容易讓標簽畫像系統失去用戶的信任。
如何評估?
可以從以下三層來評估標簽效果和價值
1.????數據層面
一般使用三個指標:覆蓋度,準確度,穩定性
1)覆蓋度是指在一個標簽中,有業務含義的人群數量與總人群數量的比例。
舉個例子:【優惠券敏感度】標簽,全量用戶是100萬的規模,其中20萬打上了“高”標簽,20萬打上了“中”標簽,30萬打上了“低”標簽,其他30萬人都沒有打上任何標簽。那么,【優惠券敏感度】標簽的覆蓋度就是70%。這個覆蓋度還算是可以,如果
覆蓋度過低可能會有下面的負面影響:
用標簽進行人群圈選的時候,人數過少,無法滿足運營活動對樣本量的最低要
用標簽統計平臺用戶的特征時,和真實情況會有統計偏差,即樣本無法代表整體。
一般而言,用戶自己填的標簽和模型算法打出來的標簽,覆蓋度會偏低。
2)準確度是指給用戶打的標簽中,準確反映事實的人群數量與總人群數量的比例。
舉例子:【性別】標簽,總用戶100萬,真實情況是男60萬,女40萬,系統打標成男50萬,女30萬,其他20萬 根據交叉矩陣,真實是男且標簽是男用戶40萬,真實是女且標簽為女用戶25萬,則標簽準確率為 ?(40 + 25)/ 80 = 81.25%
真實情況是現實世界標簽的準確度往往是很難評估的。一般會用一些外圍樣本數據來輔助驗證,比如對于性別標簽,可以抽樣讓客服電話調研拿到真實性別數據,通過樣本來估算整體。
3)穩定性是指給用戶打的標簽中,能在指定時間點前被準確計算出來的次數比例。
舉個例子,信貸行業中的關聯指標【通訊錄中近30天有借款逾期人員的比例】,這類指標需要計算幾個億的通訊錄表,和業務表關聯好幾次,計算復雜度高,高峰時期容易跑不出來。穩定性標簽還要根據各標簽的計算復雜度來綜合評估,一般靜態類標簽穩定性比較高,算法預測類標簽復雜計算邏輯或者關聯上下游表比較多的標簽在特殊情況下穩定性會差一些。一般而言,穩定性要達到99%以上才能被業務接受,關鍵時刻不能掉鏈子。
2.????應用層面
1)????用戶覆蓋度
可以使用兩個指標衡量覆蓋度:產品觸達率和產品打開率
產品觸達率?=? 觸達用戶數 /? 目標用戶數
舉個例子:標簽產品目標用戶(產品,運營)共計100人,知道該產品的用戶80人,則觸達率為 80%
產品使用率?= 使用過的用戶數 / 觸達用戶數
2)標簽使用度
使用度可以綜合從以下幾個指標評估,包括 使用次數,使用熱度,服務調用次數。可考慮人均聚合或者階段匯總聚合。對于應用使用度低的標簽,可以針對性地進行分析,不斷提升每個標簽的使用價值。
3.????業務層面
業務價值是業務人員對標簽系統的主要考核價值。標簽系統業務層面的應用很廣泛,從精準營銷,精細化運營到個性化推薦,廣告匹配系統,BI系統。以精準營銷平臺為例,一般業務價值可以從降本增效來考慮,比如營銷成本降低,營銷頻次提高,營銷人效提升等角度來衡量。
參考指標:
營銷成本降低:以前運營圈人活動平均響應3天 -> 現在0.5天
覆蓋場景數提升:以前一周內覆蓋50%運營場景 —> 一周內覆蓋90%運營場景
觸達用戶數提升:每日觸達2萬用戶 —> 每日可觸達10萬用戶
營銷ROI提升:
另外一個比較好的指標就是業務運營的ROI,業務如果用了一個標簽,對一群人進行了投放,ROI是日常投放的好幾倍,那這個標簽的價值可以說是毋庸置疑了。這時,我們可以說這個標簽的業務價值很高。標簽系統實際上可以大幅降低了業務運營的成本,導致整體ROI提升,這需要和業務配合一起做評估。比如有個同類活動在使用標簽系統前的ROI和使用后的ROI對比,更會彰顯標簽系統的價值。
如果能找到一些和業務核心KPI直接掛鉤的評估手段,那會更加彰顯標簽平臺的重要性。
這里有個問題:如何去準確統計這些指標,需要數據同事和業務同事溝通敲定
標簽體系的業務價值衡量,確實是個難點,很難直接評估。而業務向上匯報過程中往往會將“標簽平臺”價值一帶而過,強調“人”和“運營”的重要性而忽視“工具”和“平臺”的重要性。這就需要數據同學自己具備業務價值量化評估的能力,一個好的方式是多和業務部門合作,參加業務部門運營活動會議,用數據去影響和驅動業務部門,讓業務離不開數據團隊,自然業務就會在給大老板的匯報中多多提現“數據標簽”的價值。這樣才能實現業務和數據團隊的雙贏局面。
用戶標簽體系總結
總結下全文的創作結構如下:
1.????什么是用戶標簽體系
2.????為什么要建設用戶標簽體系
3.????如何設計用戶標簽體系
4.????如何評估用戶標簽效果
用戶標簽體系是個龐大的系統工程,不可能一蹴而就,需要隨著業務發展情況而不斷迭代完善和豐富。在設計過程中,需要拋棄一上來就大而全的設計理念,根據業務需求場景來逐步落實和豐富標簽,畢竟能產生業務價值才是評價標簽體系的根本。還要不斷研究和學習業界優秀的標簽平臺(CDP/DMP平臺)會給自己設計產品帶來一些靈感,比如業界做的比較好的像 神策數據用戶畫像,騰訊廣點通,阿里達摩盤,字節跳動CDP等。
企業在發展的過程中,要依據具體的數據成熟度和數據應用度來衡量是否有必要建立自己的用戶標簽體系。大廠標配的CDP平臺并非適用于所有公司。希望業界朋友都能認識到數據驅動的價值,而數據產品存在的本質也就是 降低企業經營和業務決策的成本,不是嗎?
原文鏈接:https://coffee.pmcaff.com/article/xeBOgnrEBM/coffee
推薦閱讀
《標簽類目體系:面向業務的數據資產設計方法論》
推薦理由:標簽類目體系是數據中臺理念落地的核心組成部分,是實現數據資產可復用、柔性組合使用、降低數據應用試錯門檻的強力支撐。
本書旨在培養資深的數據資產架構師及數據運營專家,以方法教育而非工具實施的方式助力企業建立自身的數據資產化能力,將數據能力Z大限度地轉化為商業價值。
《用戶畫像:方法論與工程化解決方案》
推薦理由:這是一本從技術、產品和運營3個角度講解如何從0到1構建用戶畫像系統的著作,同時它還為如何利用用戶畫像系統驅動企業的營收增長給出了解決方案。作者有多年的大數據研發和數據化運營經驗,曾參與和負責多個億級規模的用戶畫像系統的搭建,在用戶畫像系統的設計、開發和落地解決方案等方面有豐富的經驗。
更多精彩回顧
書訊 |?2月書訊(下)| 新年到,新書到!
書訊 |?2月書訊 (上)| 新年到,新書到!
資訊 |?Python迎來31歲生日,蟬聯年度編程語言排行榜冠軍
書單 |?2022 年前端趨勢的 6 個預測
干貨 |?機器人數量增長不會減少人類就業機會,反會促增崗位數量?
收藏 |?大腦如何做算術?加減法都有專用神經元,符號文字都能激活同一組
上新 |?下一代無線通信網絡:博弈建模、分析與設計
贈書?|?【第94期】存儲系統又慢又雜太難用?我們推薦這幾本書幫你解決問題
點擊閱讀全文購買
總結
以上是生活随笔為你收集整理的用户标签体系的设计和效果评估的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: module和package是什么
- 下一篇: web前端颜色配色大全