这个时代最重要的技能之一(数据分析)
大家好,我是Z哥。
首先說明一下,今天不賣課程哈,就單純聊聊我在做數據分析時的一些經驗。
在如今這個數據爆炸的時代,我們每天不管是主動還是被動,都會面對大量的數據撲面而來。
如果有較好的數據分析能力,不管是對你的生活還是工作,都將帶來巨大的幫助。因為你比別人擁有更好的“洞察力”,看到別人看不到的信息,這些信息可以幫助你更好地做出決策。
很多人做數據分析的時候經常會遇到一個問題,面前擺著一堆海量的數據,但是不知道怎么分析,從何下手,以此來得到一些有用的結論。
我最開始也深受這個問題的困擾,想了好久才明白這里的問題所在,所以今天我把我思考后的思路分享給你,希望能對你有所幫助。
一個合理的數據分析思路,不但可以幫助你高效地獲得對你有價值的信息,還能提高結論的準確性。
我的思路其實是一個構建「點->線->面->體」的過程,主要分為以下六個步驟。
/01? 帶著目的/
如果你會覺得無從下手,大概率是因為目的不明確,或者說缺少目的。
沒有目的,何以解決問題?寄希望于某個牛逼的方法能夠“點石成金”?但是,誰來告訴你這個方法呢?靠上帝嗎?
這個道理說透了其實很容易明白,但現實卻是很多人陷在數據的海洋中無法自拔,認為先收集足夠多的數據,然后再分析,就能從中得到一些有價值的結論。這個邏輯其實你細想一下是有問題的,因為不同的人看待同樣的數據得出的結論往往是不同的。因此,如果你沒有清晰的目的,再多的數據也沒有意義。
所以,先確定目的就是先明確「點」,只有有了「點」,我們才能繼續延伸去構建我們的「線面體」。
目的一般分為以下兩種。
找原因。當前面臨一些問題,從數據中找出相關因素。
找規律。從數據中提煉出一些規律,趨勢,幫助未來做決策。
所以,不妨先明確一下,你是要找原因?還是找規律?
比如,我們分析網站訪問量為什么下滑。很明顯,這個目的是「找原因」。
/02? 分解目的/
明確了目的,就有了一個大方向,剩下的就是分解目的。
分解目的的方法論有很多,MECE、5W2H 等等都可以。
按照 MECE 法,以「不重疊、不遺漏」的方式將數據分析的目的拆解成多個子問題。
5W2H 法很常見,就是what、why、when、where、who、how、how much。
還有一個我覺得很好用的方法論,從 GrowingIO 那學來的。就是一個「業務目標 * 業務流程 * 業務場景」的三級結構。先列出業務目標,然后展開每個目標的流程,再展開流程上的每一個環節對應的場景(場景中蘊涵著關鍵指標)。
這個方法其實一次性就把「線面體」的大框架構建完了。
在我們的案例中,影響訪問量的因素有很多,對于這個目的的分解用 MECE 方法更合適。我們也可以用思維導圖來實現。
/03? 驗證子問題/
通過 MECE 方法將目標分解完之后,其實就已經把「線和面」構建完了,接下去就是最后一步,構建「體」。
構建「體」的過程其實就是思考如何驗證其中的每一個子問題。
怎么驗證?先建指標。現代管理學之父彼得·德魯克說過一句很經典的話:
如果你不能衡量它,那么你就不能有效增長它。
所謂衡量,就是需要建立統一的標準來定義和評價。你認為的不錯,別人不一定這么認為,老板可能還認為很糟糕。所以,建立指標的目的其實就是統一口徑,使得同一份數據能讓更多人得到一致的理解。
建立和使用單一指標是數據分析的第一步,接下來你需要建立指標體系,因為孤立的指標發揮不出數據的價值。
一個還不錯的指標體系,至少要滿足以下三點:
有三個以內的核心指標。核心指標不僅僅是數字,是所有人需要盯著看去努力的。就像銷量和銷售額,用戶數和活躍用戶數,大多數情況下后者都比前者重要。
指標之間存在關聯性。
單一指標至少有兩個以上維度。(比如,同比、環比等)
指標體系沒有放之四海而皆準的模板,不同業務形態有不同的指標體系。移動 APP 和網站不一樣,SaaS 和電子商務不一樣,低頻消費和高頻消費不一樣。比如婚慶業務不需要考慮復購率指標;互聯網金融必須要風控指標;電商領域里的用戶需要分為賣家和買家,而且他們的指標各不一樣。
對我們上面的案例,擺上指標后大致是這個樣子。
/04? 清洗數據/
好了,「體」建設完之后,接下來就是把數據填入進去了。但是在復雜的數據分析場景下,我們可能在數據填入之前還要做一件事。
由于在實際的業務場景中,原始數據可能會來自于各個內部以及外部系統。指標口徑對不上,總會出現不一致、重復、不完整、存在錯誤或異常的數據。
因此需要通過一些額外操作對這些數據做清洗,得到符合我們要求的原始數據。我們這里不講太技術性的東西。從邏輯上主要做以下幾件事。
數據清洗:去掉噪聲和無關數據
數據聚合:將多個數據源中的數據結合起來存放在一個一致的數據存儲中
數據轉換:把原始數據轉換成為適合做分析的數據格式。
/05? 用數據驗證/
好了,框架搭好了,原始數據也有了。剩下的就是通過數據來驗證猜想了。
怎么驗證呢?
這里我又要給出一個大殺器了,就是多用「演繹法」,而不是「歸納法」。
雖然這倆這都屬于邏輯思維,但是歸納法有一個很大的問題:因為我們不可能觀察到某個事物的所有影響因素,所以歸納法得出的結論是不一定是正確的。
比如,某個指標下降了 5 %,真的是個不好的情況嗎?不一定,如果行業下降了 20 %,你才下降了 5 %,這就是一個還不錯的結果。
而演繹法的本質是,找到發生變化的原因,如果某個原因在未來還會繼續存在,那么可以支撐某個結論。
比如,行業為什么下降了 20 %?導致下降的原因未來是否還會存在?如果這些因素無法消除,那么未來繼續下滑是在預期之內的。
/06? 保持迭代/
當你形成了一套自己的數據分析體系之后,還不能一勞永逸,需要保持迭代。因為在業務的不同時期,我們關注的點會不同。
比如,在業務的初期,我們會更多關注流量、轉化率這些,但到了成長期以及成熟期之后,還需要關注用戶活躍度、復購率等等數據指標。
好了,這次就聊這么多。慣例總結一下。
這篇呢,Z 哥和你分享了我在數據分析上的一些經驗。
我的思路其實是一個構建「點->線->面->體」的過程,主要分為以下六個步驟。
帶著目的
分解目的
驗證子問題
清洗數據
用數據驗證
保持迭代
希望對你有所幫助
從本質上看,真正要做好數據分析這件事,本身對一個人商業理解、業務能力有很高的要求。因為只有有了這些能力,我們才能知道我需要哪些數據,才能識別出哪些數據是對我有用的,以及我可以如何運用這些數據。這些對數據分析有著事半功倍的效果。
引用一張 GrowingIO 的圖,分別展現了數據分析相關工作的投入產出比。
可以看到,看上去越偏技術性的工作,其實產生的單位價值反而更低。所以,你知道該怎么做了吧?
推薦閱讀:
對DDD的常見誤區
如何擺脫「自我否定」狀態
原創不易,如果你覺得這篇文章還不錯,就「點贊」或者「在看」一下吧,鼓勵我的創作 :)
也可以分享我的公眾號名片給有需要的朋友們。
如果你有關于軟件架構、分布式系統、產品、運營的困惑
可以試試點擊「閱讀原文」
總結
以上是生活随笔為你收集整理的这个时代最重要的技能之一(数据分析)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【DotNetMLLearn】.NET
- 下一篇: WTMPlus 低代码平台来了