用户行为分析案例——天池数据集User Behavior Data from Taobao
用戶行為分析過程
- 說明
- 一、數(shù)據(jù)集與分析目的
- 1、數(shù)據(jù)集
- 2、分析目的
- 二、數(shù)據(jù)處理
- 1、數(shù)據(jù)預(yù)覽
- 2、數(shù)據(jù)處理
- 三、數(shù)據(jù)提取與分析
- 1、網(wǎng)站流量分析
- 2、用戶分析
- 3、商品銷售分析
- 四、總結(jié)
- 1、關(guān)于平臺流量與轉(zhuǎn)化率:
- 2、關(guān)于網(wǎng)站用戶粘性以及用戶消費習(xí)慣
- 3、關(guān)于商品銷售情況
說明
本次數(shù)據(jù)分析基于阿里云天池數(shù)據(jù)集(用戶行為數(shù)據(jù)集),使用轉(zhuǎn)化漏斗,AARRR模型,對常見電商分析指標(biāo),包括轉(zhuǎn)化率,PV,UV,留存率,復(fù)購率等進行分析,分析過程中使用MySQL以及Navicat進行數(shù)據(jù)預(yù)覽與清洗處理,使用Excel進行數(shù)據(jù)可視化。
一、數(shù)據(jù)集與分析目的
1、數(shù)據(jù)集
| user_id | 整數(shù)類型,序列化后的用戶ID |
| item_id | 整數(shù)類型,序列化后的商品ID |
| category_id | 整數(shù)類型,序列化后的商品所屬類目ID |
| behaviortype | 字符串,枚舉類型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
| timestamps | 行為發(fā)生的時間戳 |
該數(shù)據(jù)集記錄用戶在淘寶網(wǎng)站瀏覽商品產(chǎn)生的行為信息。由于數(shù)據(jù)集過大 ,選取其中10200位用戶,共105萬條數(shù)據(jù)。
2、分析目的
1)了解網(wǎng)站流量情況;
2)了解該階段網(wǎng)站用戶粘性以及用戶行為習(xí)慣;
3)了解網(wǎng)站商品銷售情況;
分析邏輯如下:
二、數(shù)據(jù)處理
1、數(shù)據(jù)預(yù)覽
MySQL建表,使用Navicat導(dǎo)入數(shù)據(jù)
use userbehavior; create table user( user_id int not null, item_id int not null, category_id int not null, behavetype varchar(10) not null, times int not null, constraint user_behave PRIMARY KEY (user_id,item_id,times))2、數(shù)據(jù)處理
(1)日期處理
將行為發(fā)生時間轉(zhuǎn)為datetime類型,獲取其發(fā)生日期及時間
(2)數(shù)據(jù)清洗
DELETE FROM user WHERE datentime < '2017-11-25 00:00:00' OR datentime > '2017-12-04 00:00:00';三、數(shù)據(jù)提取與分析
1、網(wǎng)站流量分析
- 創(chuàng)建用戶行為視圖
(1)用戶參與度(pv)分析
分析:11月25日至12月1日使用用戶數(shù)變化幅度小,范圍在7000到8000之間,從12月2日有較大幅度增加,對比11月25,26(周末)有較大的提升,可能是周末的雙12預(yù)熱營銷活動效果。
(2)網(wǎng)站購買轉(zhuǎn)化率(uv)(支付轉(zhuǎn)化率=支付訪客數(shù)/總訪客數(shù))
select activeuser.dates,activeuser.ac,alluser.au,concat(round(activeuser.ac/alluser.au*100,2),'%') conversion from (SELECT dates,count(distinct user_id) ac FROM taobaouser.userbehave where buy<>0 group by dates) as activeuser join (SELECT dates,count(distinct user_id) au FROM taobaouser.userbehave group by dates) as alluser on activeuser.dates=alluser.dates
支付轉(zhuǎn)化率在11月30日取得最高值,之后呈大幅下降趨勢。
(3)轉(zhuǎn)化漏斗
獨立訪客轉(zhuǎn)化率能達到69.9%,但是從訪客行為來看,瀏覽到購買轉(zhuǎn)化率只有2.3%,若要了解具體環(huán)節(jié)的轉(zhuǎn)化率,需要對整個流程接觸到的版面進行細(xì)化的數(shù)據(jù)分析。
2、用戶分析
(數(shù)據(jù)有限,用戶新增及激活不做分析)
(1)留存
計算新增留存率與活躍留存率,視該時間段內(nèi)首次登陸為新增用戶,購買為活躍用戶
新增活躍率:
將25日登陸用戶作為新增用戶來看,次日,3日留存率能達到60%以上,7日留存率達到了90%以上,用戶粘性很好,高新增留存率可能與處于雙十一促銷時段有關(guān),說明產(chǎn)品新手引導(dǎo)性很好。
活躍留存率:
活躍留存率在20%上下浮動,同時在12月3日有稍大幅度的上升,由于用戶新增時期未知,活躍留存率維持在20%是不錯的現(xiàn)象。
(2)變現(xiàn)——復(fù)購分析
SELECT user_id,count(*) FROM taobaouser.user where behavetype='buy' group by user_id
復(fù)購次數(shù)集中在1-5次,呈長尾分布,該階段用戶消費欲望不大。
(3)用戶消費習(xí)慣分析
一天中各時段用戶行為分析:
使用切片器分別觀察每天用戶行為:
用戶瀏覽量峰值在晚上20-23點;加購率往往在早間6-7點,晚間22-23點達到峰值;收藏率往往在早間5-7點,下午16-18點達到峰值;夜間3-4點(消費欲望),上午10-11點,下午14-15點,晚上20點22點為購買轉(zhuǎn)化率峰值,其中10-11點轉(zhuǎn)化率最高。
網(wǎng)站可以利用這些時間點進行營銷活動安排。
另外總體來看購買轉(zhuǎn)化率更貼近于收藏率,可以適當(dāng)利用來進行銷售量預(yù)測。
(4)用戶價值分析
借鑒RFM 模型,暫時不考慮M維度,對R(最近一次購買時間)F(購買頻率)進行打分,完成用戶分層
3、商品銷售分析
(1)商品銷售分布
大部分銷售來源于銷售次數(shù)為1的16190個商品,說明該時段銷售主要源于長尾部分,而非銷售數(shù)量較高的暢銷品。
(2)暢銷品及其品類分析
SELECT category_id,item_id,cartbox,dense_rank() over (order by buy desc) r FROM taobaouser.onitem where buy<>0 limit 20查看銷量top20的商品及品類分布:銷量為前3的商品為3122135,2964774,3237415,分屬1516409,1265358,3231625類
查看瀏覽top20的商品及品類分布:瀏覽量為前3的商品為812879,138964,3845702,分屬4756105,3607361類
查看收藏top20的商品及品類分布:收藏量為前3的商品為2818406,2308741,3330337,分屬982926,4827153,4756105類
查看加購商品top20及品類:加購量為前3的商品為1535294,2331370,3031354,分屬3848953,3607361,2735466類
通過分析銷量高的品類的商品銷量都不低,建議通過調(diào)研等方式推出細(xì)分市場的商品類型,并跟進后續(xù)數(shù)據(jù)。
(3)商品購買轉(zhuǎn)化率
SELECT item_id,category_id,pv,buy,concat(round(buy/pv*100,2),'%') conversion FROM taobaouser.onitem order by conversion desc limit 200
對于商品瀏覽量高,而轉(zhuǎn)化率非常低的,建議商家對商品購買流程使用轉(zhuǎn)化漏斗進行分析并進行改善。
四、總結(jié)
1、關(guān)于平臺流量與轉(zhuǎn)化率:
- 整體來看從瀏覽到有購買意愿有6.5%的轉(zhuǎn)化率,從有購買意愿到有購買行為有28%的轉(zhuǎn)化率,說明大多數(shù)用戶以瀏覽頁面為主而購買轉(zhuǎn)化較少,低購買意愿轉(zhuǎn)化率可能與剛完成的雙11大促有關(guān)。從9天的趨勢來看,前7天轉(zhuǎn)化率處于穩(wěn)步上升階段,說明雙11之后的消費情況在回升,進入12月之后,瀏覽量有稍大幅度的提升,加購轉(zhuǎn)化率有小幅提升,購買轉(zhuǎn)化率大幅下降。是否需要提高轉(zhuǎn)化率,可以對比去年同時段轉(zhuǎn)化率情況,使用使用營收目標(biāo)判斷轉(zhuǎn)化率是否達到目標(biāo)。
提高加購轉(zhuǎn)化率的建議:
——優(yōu)化搜索引擎,利用用戶畫像優(yōu)化商品匹配;
——優(yōu)化商品界面加購與收藏按鍵布局,以便用戶觸達。
2、關(guān)于網(wǎng)站用戶粘性以及用戶消費習(xí)慣
- 網(wǎng)站留存較為穩(wěn)定,把9天中第一次登錄視為用戶新增的話,留存率在60%左右,活躍留存率也能達到20%,并且營銷活動帶來的用戶喚醒效果也很明顯。
提高用戶留存建議:
——分析流失用戶特征,進行用戶流失預(yù)測,結(jié)合用戶畫像,通過各種活動進行用戶喚醒。 - 對于用戶復(fù)購情況,9天內(nèi)網(wǎng)站有復(fù)購現(xiàn)象的用戶數(shù)接近60%,但是總體上約30%的用戶產(chǎn)生了80%的消費次數(shù),復(fù)購次數(shù)多的用戶偏少,可能與雙11剛結(jié)束,雙12未開始的特殊時段有關(guān),建議拉長分析區(qū)間分析復(fù)購情況。
-——提高復(fù)購率的建議:開展?fàn)I銷活動,比如淘寶的達成金主的條件限制,鼓勵用戶復(fù)購。 - 對于用戶消費習(xí)慣的分析,通過了解用戶消費的集中時段集中實施各種營銷活動,提高投入產(chǎn)出比。
3、關(guān)于商品銷售情況
- 分析發(fā)現(xiàn)商品售賣主要依靠長尾商品的累積效應(yīng),而非爆款商品的帶動,這也是雙11之后用戶的補充采買的特征,同時發(fā)現(xiàn)此時用戶購買的品類以及商品的瀏覽量很低,用戶的個人喜好特征表現(xiàn)明顯,同時瀏覽量高的商品購買轉(zhuǎn)化率低。
-——針對瀏覽量高而購買轉(zhuǎn)化率低的商品,建議商家改善商品頁面,詳情頁以及評論區(qū)管理。
一起學(xué)習(xí),共同進步,歡迎大家評論!
總結(jié)
以上是生活随笔為你收集整理的用户行为分析案例——天池数据集User Behavior Data from Taobao的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SkinFiner(人像磨皮软件)官方中
- 下一篇: 软考高级信息系统项目管理师视频下载