杏树林孙文亮:在线医疗数据驱动实战
伴隨醫療水平的提升、醫療應用場景信息化建設的加速,醫療行業對大數據的需求有增無減,并主要集中在提升醫療效率和醫療水平,實現數據驅動業務發展等方面。在大數據驅動醫療行業發展的浪潮中,有一些企業走在了前沿。
杏樹林信息技術(北京)有限公司(下稱“杏樹林”)是一家專注于移動互聯網醫療應用解決方案的公司,專注為醫學專業人士開發移動工具,讓行醫更輕松。 公司旨在為中國的醫務工作者提供基于智能手機和平板電腦的臨床信息服務。
近期,杏樹林數據分析負責人孫文亮公開分享了數據驅動的基礎設施,從產品、運營、技術三個方面介紹如何深入應用大數據,并利用數據驅動業務的實踐,具有一定的行業指導意義。
工欲善其事,必先利其器。要想讓數據更好的為各部門所用,驅動業務增長,就需要堅實的基礎建設,包括標準建設和數據系統建設兩大部分。杏樹林在今年3月份接入神策數據,為了提升溝通效率,讓后續的工作事半功倍,需要定義規范和標準建設。
命名規范區分行為和功能,標準要統一。區分行為和功能是規范的重點。功能是每一個產品獨特具有的東西,有可能是功能點、功能聚合,也有可能是功能本身;行為是在任何功能里都會存在的,比如說新聞、藥典都會有點擊和訪問事件。
命名三選其一。孫文亮介紹,命名有三種方式,分別是按行為命名、按功能命名、按照功能與行為交叉命名。他強調,三者只能選其一,統一規范命名方式將會為后續的工作帶來很大便利。
開工前要定義清楚公共行為和公共屬性。公共行為一般是指激活,注冊,升級,推送等行為。公共屬性更常見,例如渠道,頁面名稱等。渠道有可能叫 channel,也有可能叫source。 這些如果不在開工前定義清楚,后期統計會遇到很多問題。
流程規范,整個流程數據人員都應參與。一個規范的操作流程能夠加速數據驅動的進展。 舉個反面例子,數據組經常會收到一些需求:這是一個運營活動,需要統計一下數據。但此時活動已經做完,其中已經有數據缺失了,如何也補不上,這給后續統計分析增加了難度。再比如,產品已經上市了,需要增加新的統計數據,不得不等待下一個版本增加埋點。
所以,在方案設計、排期開發、測試、上線的整個流程中都要有數據人員參與,一旦養成這個習慣,會很輕松地完成迭代,也不會出現溝通錯位,或者是事后諸葛亮的問題。
兩大核心模塊構建杏樹林數據驅動系統。杏樹林大數據平臺分為兩個核心模塊,一邊是以神策數據為主的分析系統,還有一邊是Analytics DB為主的數據庫。
首先,將一切行為數據(如:iOS、安卓、網絡時間等)都報進神策系統。同時,使用 RabbitMQ(應用程序對應用程序的一種通信方法)、Kafka(一種高吞吐量的分布式發布訂閱消息系統,它可以處理消費者規模的網站中的所有動作流數據)來做平常的業務行為和業務日志的采集,可以不用埋點直接把相關的日志數據接入到這兩個系統中。
其次,在 Analytics DB?(分析數據庫)實現代碼質量監控、JIRA(項目與事務跟蹤工具)接入、電子表格數據導入等操作,便于后期進行可視化展現和分析。
最后,?Analytics DB 和 神策數據之間會有非常緊密的聯系。這主要是因為神策數據提供了非常強大的計算能力,而 Analytics DB 數據庫計算能力比較弱,所以會將需要計算的數據導入到神策,計算完成后,再導回到 Analytics DB 中。同時,神策數據本身收集的數據也會最終匯總到? Analytics DB 中。這就是杏樹林數據驅動系統的一個概況。
神策數據的分析系統實現深入性的數據挖掘。在產品迭代,優化功能過程中,對于用戶分群、不同科室、不同醫生訪問情況、對產品功能的反饋等,神策數據提供一個非常完善的模型,通過多維度分析很好地達到分析的目的。我們知道,優化一個產品,優化完了之后,不可能再優化第二次,所以無論產品迭代,還是運營活動等都是不復制的。通過神策數據,杏樹林將一次性或臨時需求從每月的200多個降低到了80個。
報表系統實現日常監控。尤其是業務核心指標,需要長期的觀察,這個時候需要用到報表系統做深度的報表設計。報表設計選擇了最恰當的維度和統計量。通過這些精心挑選的維度和數據,可以讓公司人員對日常運營情況了如指掌。
基礎設施建設完畢,就可以使用數據來驅動業務了。
產品全景功能圖,快速了解哪個功能才是用戶的最愛。下圖是公司管理層非常喜歡的產品全景功能分布圖:
通過這張圖,管理層能夠迅速知道不同的功能表現出怎樣的特性,以及用戶喜歡哪些功能,進而輔助戰略決策。
產品全景功能分布圖為產品優化提供依據。對于低頻低留存的功能點D,可以考慮是否將其路徑埋的更深一些。比如:大家常見的 “設置” 功能,事實上是一個不常用的功能,可以將入口埋的更深。而對于高頻高留存的功能C,和功能I,就考慮將其入口設置的更淺一些,方便用戶找到和使用。
產品全景資源分布圖,讓好鋼用在刀刃上。通過產品全景資源分布圖,可以知道公司是否將最好的資源花在了那些對用戶真正重要的功能上。如圖所示:
可以看到,橫軸是完成需求所需的資源,縱軸是神策數據統計到的這個功能的訪問量。每個點的斜率其實就可以反映出這個功能需求的性價比了。通過這個圖表,就可以輔助管理層做功能開發的優先級排序了。
通過細分構建因果鏈評估產品迭代效果。舉一個例子,產品經理優化了功能A,發現整個APP的周活躍用戶量(WAU)增長了,就會認為這是他的功勞。這雖是人之常情,但事實并不一定是這樣。影響整個APP活躍用戶量的因素有很多,有可能是功能A優化的結果,也有可能是因為做了一場市場活動,或者是遇到了假期等特殊情況。所以,從整體數據來看,很多時候只能找出相關性,只有從細分數據才能找到真正的因果鏈。
從APP整體的活躍度、高頻比,一直細分到功能塊的功能點的活躍程度、高頻比,可以從中找出真正的因果鏈。 通過功能點A自身的活躍、留存、高頻比數據的變化,讓產品經理知道功能A的優化是否產生了作用。
運營一般分為兩大類:日常運營和運營活動。日常運營,即通過類似內容的更新、用戶反饋等工作,判斷效率和質量是否提升:更新的頻率是否高了?內容的閱讀量相比上個月是否上升?
運營活動是周期性的,是對目標、渠道和轉化率的優化與評估。拉新促活是重點目標,需要更多的資源投入。每一次運營活動的渠道和轉化率評估,則有助于找到更優的導流渠道,優化投入產出比。
運營的績效并不是工作是否完成,而是效率和質量是否有提升,這才是運營績效的核心,才能用數據驅動持續前進。
數據驅動和持續交付能力是相輔相成的。持續交付能力的提升,讓數據驅動變得高效,而數據本身對于技術團隊的持續交付能力也是有幫助的。
除此之外,技術負責人可以通過這些報表來判斷迭代是否穩定、持續交付能力是否得到改善,從而優化整個團隊的工作。
此外,杏樹林通過報表和數據來優化產品的性能和可靠性。比如,一個功能的響應速度從4.5版本的800毫秒下降到400毫秒,但是在后續更新后的版本中,這個響應速度又飆升上來。此時,則需要通過數據來找到具體原因,快速定位問題。
通過神策分析,點擊進入不同版本中,來查看具體的數據,進而發現真正的問題點,然后對癥下藥。
此外,通過數據還可以看到在具體功能點上投入的技術資源,最終產生實際效果的增長情況,幫助公司將有限的技術資源投入到更有產出比的項目上,提升整體的技術產出能力。
在不斷實踐中摸索數據驅動“心法”。若將數據驅動比作神功,修煉神功有兩個要點:一個是招式,另一個心法。招式對應的是實戰案例,心法對應的是方法論。招式每個公司都是不一樣的,最終起決定作用一定是心法本身,背后的方法論。孫文亮強調,只有在不停的實踐中,才能發現屬于自己的“心法”,而這個“心法”并不是換到任何一個環境下都是通用的。希望大家每個人都能快速找到自己的“心法”。
點擊下方“閱讀原文”,下載杏樹林數據分析負責人孫文亮的演講PPT哦~
總結
以上是生活随笔為你收集整理的杏树林孙文亮:在线医疗数据驱动实战的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 神策沙龙回顾:大数据技术和金融、房产、理
- 下一篇: 情人节,你们的CEO都在干嘛?