发光的二次元克拉克拉 满足年轻用户个性化、碎片化的文娱需求
克拉克拉(KilaKila)是國內專注二次元、主打年輕用戶的娛樂互動內容社區軟件。KilaKila 推出互動語音直播、短視頻配音、對話小說等功能,滿足當下年輕用戶個性化、碎片化的文娛需求。隨著業務規模增長,海量數據存儲與計算的瓶頸也日益突出,由于單臺服務器的處理能力有限,海量數據的分析需要分布式計算模型。分布式的計算模型對數據分析人員要求較高且不易維護:數據分析人員不僅需要了解業務需求,同時還需要熟悉底層分布式計算模型。MaxCompute提供完善的數據導入方案以及多種經典的分布式計算模型,可快速解決克拉克拉所面臨的海量數據的計算問題,有效降低企業成本并保障數據安全。對于使用方的我們不必關心分布式計算和維護細節便可輕松完成大數據分析,最終我們采用阿里云MaxCompute方案進行數據上云。
一、數據上云
克拉克拉(KilaKila)數據源主要分為兩部分:1.結構化業務數據表(MySQL);2.非結構化用戶行為日志
??結構化業務庫上云主要使用阿里云datax、DTS兩種工具。
▲圖一:datax數據同步
datax原理是將MySQL數據完全透明化同步至MaxCompute數據表中,是表對表的映射。
▲圖二:DTS數據同步
DTS主要以MySQL binlog方式來進行數據同步,該同步的優勢在于不會影響線上生產環境MySQL庫I/O壓力,與此同時對于刪除操作也會進行實時同步。
? 用戶行為日志上云,該日志主要使用阿里云日志服務(Log Service)組件。該組件除了滿足將海量日志存儲在MaxCompute數據倉庫中外,也解決了實時業務計算需求,如storm集群。
▲圖三:Log Service工作流
▲圖四:日志服務各Topic日志源
▲圖五:克拉克拉用戶行為日志片段
二、數據計算
為滿足各類批處理計算業務需求,基于MaxCompute建立了小時維度、天維度、月維度等不同維度的工作流以及業務流程。在數據開發階段我們使用MaxCompute的Web datawork進行任務開發、任務運維、任務監控等。
▲圖六:datawork SQL開發
在datawork中可以創建SQL腳本,通過編寫SQL語言滿足我們的臨時查詢需求。
▲圖六:datawork工作流
在datawork中可以根據業務場景配置工作流,解決生產環節中所面臨的定時計算任務等訴求。
圖七:datawork運維中心
運維中心可實時監控任務的狀態,對應不同的任務狀態進行不同情況的報警;
綜上所訴,得益于datawork強大的數據開發多樣性和豐富的內置函數,我們可以針對不同業務場景進行快速的項目開發和上線。
**
三、克拉克拉業務應用場景**
1. 報表系統
▲圖八:克拉克拉BI報表系統架構
基于MaxCompute與quickBI組合快速構建了業務報表系統。該系統通過datawork部署系列報表計算任務,最終的計算結果可存儲MaxCompute表中以及MySQL表中。quickBI通過數據源關聯即可實現前端趨勢圖靈活展示。
圖八:克拉克拉BI報表系統
2. 克拉克拉(KilaKila)榜單業務
圖九:克拉克拉榜單業務計算場景
通過MaxCompute滿足了克拉克拉主播排行榜、熱門榜單等排序業務。
3. 對外開放接口平臺(Restful API )
為了滿足第三方通過API接口獲取克拉克拉數據倉庫中的用戶標簽數據,基于MaxCompute Lightning架構搭建開放接口服務,通過該服務的網關鑒權機制保證了授權訪問和防DDOS攻擊。
圖九:克拉克拉開放接口結構
4.算法業務
阿里云機器學習平臺是構建在阿里云MaxCompute(原ODPS)計算平臺之上,集數據處理、建模、離線預測、在線預測為一體的機器學習平臺。克拉克拉(KilaKila)預測算法業務、推薦業務等相關項目均建立在機器學習平臺基礎上,項目上線快且效果符合預期。
▲圖九:克拉克拉短視頻推薦業務
圖十:克拉克拉渠道ROI預測業務
通過阿里云所提供大數據解決方案,除了解決了克拉克拉所遇到的大數據挑戰,也極大的縮短了克拉克拉(Kilakila)諸多數據項目從想法到落地的研發周期。
更多內容:
1.《克拉克拉:基于阿里云PAI實現渠道ROI投放預測系統》
2.《克拉克拉(KilaKila):借力阿里云快速構建短視頻推薦系統》
3.《克拉克拉(KilaKila):大規模實時計算平臺架構實戰》?
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的发光的二次元克拉克拉 满足年轻用户个性化、碎片化的文娱需求的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【开发者成长】“机器学习还是很难用!”
- 下一篇: 涂鸦智能dubbo-go亿级流量的实践与