商业数据分析流程
數據分析大體上的分析結構如下所示(分析流程圖如下所示):
首先,需要對現狀和預期有一個很好的把握。其次,弄清現狀和預期之間的差距,并調查導致差距產生的關鍵因素,即發現問題。這樣的因素可能很多,所以要收集數據和加工,并在此基礎上進行數據分析。主要是挖掘出導致此問題發生的關鍵性因素,然后綜合考慮時間成本和金錢成本等情況,提出對策以解決現有問題。
1、現狀和預期
什么是數據分析中的問題呢?在這里主要是指,現狀與之前的預期之間存在一定的差距,導致了現在的問題發生。
2、發現問題
(1)區別“問題”與“現象”。
“問題”是指我們實際需要解決的問題,而“現象”只是“問題”的一種表象,我們需求做的是挖掘出導致這種現象發生的背后問題,所以應對“現象”、“問題”加以區分。例如,在商業活動中,“客戶流失”、“銷售額下降”等只是“背后問題”表現出來的現象,需要相關負責人討論發現需要解決的問題。
(2)牢記“預期”,并認識到“現狀”與其之間的差距。
找到問題需要認清“現狀”與“預期”之間的差距,而找到差距需要則需要對數據進行觀察(很好的理解預期,然后根據現在的情況發現導致問題發生的本質性原因),并且將數據進行分解后觀察(例如銷售額下降了,到底是購買人數下降了還是人均消費金額下降了,或者是兩者都下降了),然后對數據進行比較觀察(進行同期比較或不同企業之間進行比較,或對消費群體進行細分再比較,如按照年齡、性別等特征分組比較)。
3、數據的收集和加工
(1)數據收集
首先判斷需要用到哪些數據,以及需要考慮數據的獲取難度以及成本,當一些必要數據獲取不到或者成本較高時,是否可以用其他數據替代。
(2)數據加工
若數據從不同的文件中或數據庫不同的表中獲取出來,則可以先對數據進行整合,然后可以根據要研究的問題生成判定變量或者離散變量,主要用于方便建模。
4、數據分析
商業數據分析根據問題種類主要分為“決策支持”與“自動化·最優化”兩大類。
決策支持主要利用簡單求和、交叉列聯表等統計方法對數據進行分析。
自動化·最優化則利用機器學習中模型對數據進行分析,是對決策支持的深入分析,找出解決問題的途徑與方法,挖掘潛在的信息。
5、解決對策
基于分析結果判斷是否采取相應的解決對策。
參考:《數據分析實戰》
總結
- 上一篇: js固定表头的实现(转)
- 下一篇: 一战塞尔维亚死了多少人?