关于数据埋点的认识以及在流量分析系统中的实际使用
文章目錄
- 一、前言
- 二、“埋點”知多少
- 三、“埋點”有何用
- 四、幾種埋點“姿勢”
- 4.1 前端埋點
- 4.1.1 代碼埋點
- 4.1.2 可視化埋點
- 4.1.3 無埋點
- 4.2 后端埋點
- 4.3 其它埋點
- 五、最理想的埋點方式?
- 六、流量分析系統中日志埋點
- 6.1 選擇客戶端埋點
- 6.2 服務器規劃
- 七、日志埋點的實現
- 7.1 客戶端埋點
- 7.2 服務器端開發(關鍵代碼)
一、前言
所謂的埋點就是在應用中特定的流程收集一些信息,用來跟蹤應用使用的狀況,后續用來進一步優化產品或是提供運營的數據支撐,包括訪問數(Visits),訪客數(Visitor),停留時長(Time On Site),頁面瀏覽數(Page Views)和跳出率(Bounce Rate)。這樣的信息收集可以大致分為兩種:頁面統計(track this virtual page view),統計操作行為(track this button by an event),在為一些網頁和App接下來進行流量分析以及描繪用戶畫像提供支持,是進行數據分析和挖掘的“第一步”。
二、“埋點”知多少
數據埋點作為數據采集的一種重要方式,主要用來記錄和收集終端用戶的操作行為,其基本原理是在App/H5/PC等終端部署采集的SDK代碼,當用戶的行為滿足某種條件的時候,比如進入某個頁面、點擊某個按鈕等,會自動觸發記錄和存儲,然后這些數據會被收集并被傳輸到終端提供商,或者是通過后端采集用戶使用服務過程中的請求數據。
一個典型的埋點采集處理流程如下圖所示:
三、“埋點”有何用
終端提供商在收集到埋點數據之后,通過大數據處理、數據統計、數據分析、數據挖掘等加工處理,可以得到衡量產品狀態的一些基本指標,比如活躍、留存、新增等大盤數據,從而洞察產品的狀態。此外更重要的是隨著數據挖掘等技術的興起,埋點采集到的數據在以下方面的作用也越來越凸顯:
驅動決策:ABtest、漏斗優化、用戶增長、bug修復、精準營銷、流失用戶預警
驅動產品智能:智能推薦(千人千面)、場景化提示(私人助理)等
驅動安全:風險識別
四、幾種埋點“姿勢”
為了將海量數據采集得更加精準,為后續營造“純凈”的數據分析環境,埋點技術應運而生。數據基礎夯實與否,取決于數據的采集方式。
埋點方式多種多樣,按照埋點位置不同,可以分為前端(客戶端)埋點與后端(服務器端)埋點,其中前端埋點包括:代碼埋點、全埋點、可視化埋點。
4.1 前端埋點
前端埋點是在用戶端(APP、Web、客戶端)等嵌入數據采集代碼,比如友盟等均采用的是前端埋點,比如通過嵌入一段代碼就就可以對網頁數據的訪問數據進行采集。相比于后端埋點,前端埋點能方便收集到用戶在界面上的行為數據,比如用戶點了哪個按鈕、頁面之間的跳轉次序、停留時長等,這些數據是后面進行數據分析的主要來源。
前端埋點技術有以下三類:
4.1.1 代碼埋點
代碼埋點是直接將采集SDK集成在終端,然后不斷在此基礎上添加調整采集方案,是目前主流的埋點采集方案,其優缺點如下:
優點:
高度定制、控制精準、采集的數據豐富準確
缺點:
首先是每當有采集需求,需要開發人員不斷添加采集代碼,工作量大;
其次變更采集策略,需要發布新版本,代價巨大,存在滯后效應;
最后由于采集代碼常駐終端,不斷將采集的用戶行為數據進行記錄和上報,對于終端尤其是移動終端來說還有耗電、消耗數據流量等負載,此外在數據上報傳輸的過程中也存在丟失數據的風險。
4.1.2 可視化埋點
由于代碼埋點需要終端開發人員來執行采集方案,對業務的功能開發侵入性較高。有的公司開發出了可視化埋點技術,只需要產品與運營人員通過GUI界面進行鼠標簡單點擊,就可以隨時增加、取消、調整采集數據的位置和方式,此種埋點方式避開了終端開發人員的介入,由需求人員直接執行采集,減輕了需求傳遞過程中的信息損耗和誤解,另外可視化埋點技術往往由服務端直接下發采集的配置文件,而不用跟隨版本發布,從而加快了數據采集的流程。
具體實現方式參考:
具體實現是SDK定時做界面截圖,在截圖的同時從界面UI的根對象開始遍歷所有的可視化子對象,得到其層級關系。根據截圖和UI元素的可視化信息重新渲染頁面,識別可埋點的控件。當產品人員在后臺管理端的截屏畫面上點擊可埋點控件,設置事件關聯方面的配置,服務器保存這些配置,客戶端在獲取到這些配置信息以后,按照新配置采集數據。
4.1.3 無埋點
無埋點與可視化埋點原理基本一致,區別在于無埋點是先遍歷所有的控件和操作行為的組合情況,然后將這些組合情況交給埋點后臺,由數據分析人員選擇對哪些組合的埋點數據進行分析,其優缺點如下:
優點:
收集數據全面,無漏報
缺點:
采集數據量巨大,增加了終端流量消耗和服務器存儲負擔。
埋點的上報時機相對呆板,不能靈活的根據特定的場景進行特殊設置
前端埋點的注意事項:
頁面和控件標示上報要從頂層進行合理的設計,層次感要明顯
埋點數據的漏報和重復上報如何衡量
前端埋點不僅可以處理不需要和服務器交互的曝光和點擊事件,也可以將與服務器交互的結果,比如關注成功、分享成功、優惠券領取成功等原屬于后端埋點里的事件放在前端來上報。
4.2 后端埋點
后端埋點為了避免前端埋點的以下問題:
前端埋點需要對采集的數據壓縮、暫存,為減少移動端的數據流量,除一些需要實時上報的重要事件不限制網絡環境,其它事件一般只在wifi情況下上報,因此數據會有延遲,丟數據等弊端,而在后端采集數據,由于數據是在內網傳輸,數據傳輸的即時性強,丟失數據的風險小。
前端埋點采集程序由于需要常駐,監測實時和延遲埋點上報,不可避免的帶來額外的耗電。
前端埋點若要新增或調整采集方案,需要開發人員修改客戶端代碼,然后發版之后才能解決,受發布周期的影響較大,而且通常用戶的版本更新并不會及時,這將導致新方案不能及時覆蓋所有用戶。雖然現在部分埋點管理后臺也支持熱配置更新,但功能一般都很弱,只支持一些基礎的埋點事件熱更新部署,
注意:
很多時候并不把后端埋點獨立出來,而是混合在前端埋點中,等用戶和服務器端的交互返回結果之后,將結果進行上報。
對一下需要精確采集的數據,比如代金券發放等,實施的時候盡量采用后端埋點,除非后端無法采集到所需要的數據,前端埋點只是用來參考。此外也可以將業務數據庫代金券領取數據同步到數據倉庫中進行分析。
4.3 其它埋點
路徑埋點和獨立埋點:
這部分的埋點根據業務對路徑的追蹤需求和SDK的開發能力,可為每個事件設計上下文的路徑信息,路徑信息的組成一般由頁面、控件、行為三部分組成,而路徑的深度也不宜太深,一般小于五層。
顯性埋點和隱性埋點:
顯性和隱性是從用戶有感和無感來區分的,有感事件是用戶的主動事件,比如展示和點擊事件;無感事件主要用來處理后臺的數據請求和拉取,用以監控和服務器的數據交互是否正常等,無感事件中常用的是掃描采集,比如app啟動之后,掃描各設置開關的狀態信息進行上報等
業務埋點和監測埋點:
業務埋點是從業務需求的角度而言,比如產品需要統計某個頁面的曝光和點擊,算法人員需要的推薦項點擊率等;而監測埋點是從業務的流程上來講的,一般是指隱性的(比如服務器交互的內容拉取情況、本地潛在信息的生成情況等),此外業務埋點中的關鍵部分也可以用作監測埋點。
五、最理想的埋點方式?
回到一開始的問題:何種埋點方式最理想呢?
正如同硬幣有兩面,任何單一的埋點方式都存在優點與缺點,企圖通過簡單粗暴的幾行代碼/一次部署、甚至犧牲用戶體驗的埋點方式,都不是企業所期望的。要滿足精細化、精準化的數據分析需求,可根據實際需要的分析場景,選擇一種或多種組合的采集方式,畢竟采集全量數據不是目的,實現有效的數據分析,從數據中找到關鍵決策信息實現增長才是重中之重。
因此,數據采集只是數據分析的第一步,數據分析的目的是洞察用戶行為,挖掘用戶價值,進而促進業務增長,故最理想的埋點方案是根據根據不同的業務和場景以及行業特性和自身實際需求,將埋點通過優劣互補方式進行組合,比如:
1、代碼埋點+全埋點:在需要對落地頁進行整體點擊分析時,細節位置逐一埋點的工作量相對較大,且在頻繁優化調整落地頁時,更新埋點的工作量更加不容小覷,但復雜的頁面存在著全埋點不能采集的死角,因此,可將代碼埋點作為輔助,將用戶核心行為進行采集,從而實現精準的可交叉的用戶行為分析;
2、代碼埋點+服務端埋點:以電商平臺為例, 用戶在支付環節,由于中途會跳轉到第三方支付平臺,是否支付成功需要通過服務器中的交易數據來驗證,此時可通過代碼埋點和服務端埋點相結合的方式,提升數據的準確性;
3、代碼埋點+可視化埋點:因代碼埋點的工作量大,可通過核心事件代碼埋點,可視化埋點用于追加和補充的方式采集數據。
六、流量分析系統中日志埋點
6.1 選擇客戶端埋點
客戶端埋點:支持 iOS、安卓、Web/H5、微信小程序,主要用于分析 UV、PV、點擊量等基本指標。例:下圖是Web端的埋點技術圖:
6.2 服務器規劃
七、日志埋點的實現
7.1 客戶端埋點
在網頁流量分析系統中,采用客戶端網頁埋點實現,在其中需要埋點的頁面中的<head></head>中加入如下代碼:
<script src="tj.js"></script> 注:tj.js 就是需埋點的 js 文件
說明:
①var dest_path = "http://127.0.0.1:8081/log?", 此處要改成日志服務器的地址,并且這個地址是能夠被訪問的,最后一個 "?"不要忘加,用來拼后續參數使用的。
②埋點的原理:js代碼會動態在頁面中創建一個寬和高都是1px的圖片,圖片的地址指向了1中定義的日志服務器中的圖片,
document.getElementsByTagName("body")[0].innerHTML += "<img src=\""+dest+"\" border=\"0\" width=\"1\" height=\"1\" />";7.2 服務器端開發(關鍵代碼)
package com.logs.controller;import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.stereotype.Controller; import org.springframework.web.bind.annotation.RequestMapping;import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import java.io.UnsupportedEncodingException; import java.net.URLDecoder;@Controller public class LogController {private Logger logger = LoggerFactory.getLogger(LogController.class);@RequestMapping("/log")public void log(HttpServletRequest request, HttpServletResponse response) throws UnsupportedEncodingException {//1.獲取請求參數String qs = request.getQueryString();//2.對URL解碼String decode = URLDecoder.decode(qs, "utf-8");//3.轉換成需要處理的格式StringBuilder sb = new StringBuilder();String[] attrs = decode.split("&");for (String attr : attrs) {String[] kv = attr.split("=");String val = kv.length >= 2 ? kv[1] : "";sb.append(val+"|");}sb.append(request.getRemoteAddr());String logStr = sb.toString(); // System.out.println(logStr);logger.info(logStr);} }總結
以上是生活随笔為你收集整理的关于数据埋点的认识以及在流量分析系统中的实际使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 并发设计模式
- 下一篇: [转] Xcode 高级调试技巧