商业数据可视化分析基础知识
目錄
商業數據可視化分析目的和意義
經典案例
案例一:沃爾瑪的啤酒+尿布? ? ?
案例二:總統選舉投票可視化圖表
商業數據可視化分析的流程和步驟
明確分析目的
數據獲取
數據清洗
數據加工建模
數據可視化
發布報告
商業數據可視化分析的優點
商業數據可視化分析常用工具
EXCEL
EXCEL特點
PowerBi
下載網址
Power BI 特點
Tableau
下載網址
SQL
數據分析原理
商業數據可視化分析的現狀和需求
商業數據可視化分析目的和意義
針對海量的數據進行分析后,就要使用最簡單,最讓人容易理解的形式表現分析的結果。所以可以通過數據可視化、圖形化手段,來清晰有效地傳達與溝通信息。
但是需要注意的是這并不意味著數據可視化就一定因為要實現其功能用途而使用看上去絢麗多彩但顯得極端復雜的可視化圖形。
為了有效地傳達思想概念,可視化圖形相關的美學與功能需要齊頭并進,通過直觀地傳達關鍵的方面與特征,從而實現對丁稀疏而又復雜的數據集進行深入洞察和表現。
近幾年來,隨著信息產業以及信息技術的快速發展,人類生產的數據總量呈幾何級數與日俱增。在當前的大數據時代和5G時代的環境下,不僅每日的數據量產生了爆發性的增長,數據處理技術也得到了突飛猛進的發展,這就讓我們可以擁有發現及挖掘隱藏在海量數據背后信息,并將這些信息轉化為知識及智慧的能力。(將數據轉化為資源)
數據分析簡單來說就是對某一數據進行詳細的分析。而專業來說就是指用適當的統計分析方法對所收集來的大量數據進行分析,提取有用信息,從而形成結論并對數據加以更為詳細的研究和概括總結。
案例一:
美團當前每日的訂單量是約3000萬單,擁有的騎手約為400萬,商家多達620萬家,覆蓋了2800個市縣,所以在每天的業務處理中產生大量的數據。
案例二:
數據分析的目的其實就是對人批雜亂無章的數據中進行信息的集中、萃取和提煉出來,以便找出所研究對象的內在規律。
在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。而且數據分析是有組織、有目的地進行數據收集和分析,使之成為有用信息的過程。
摩爾定律是由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個月翻一倍以上。這一定律揭示了信息技術進步的速度。 盡管這種趨勢已經持續了超過半個世紀,摩爾定律仍應該被認為是觀測或推測,而不是一個物理或自然法。預計定律將持續到至少2015年或2020年。然而,2010年國際半導體技術發展路線圖的更新增長已經放緩在2013年年底,之后的時間里晶體管數量密度預計只會每三年翻一番。
經典案例
案例一:沃爾瑪的啤酒+尿布? ? ?
案例揭示
- 通過對數據倉庫中海量的數據進行挖掘,得出了數據隱性但實際存在的內在規律。
- 通過對大數據應用數據分析技術,將看似不相關的商品數據放在起,找出內在關聯性,進行有效策略制定,采用交叉營銷的方式從而達到促進銷量。?數據分析與挖掘
?“啤酒與尿布”的故事發生于20世紀90年代的美國沃爾瑪超市中,沃爾瑪的超市管理人員分析銷售數據時發現了一個令人難于理解的現象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關系的商品會經常出現在同一個購物籃中,這種獨特的銷售現象引起了管理人員的注意,經過后續調查發現,這種現象出現在年輕的父親身上。 在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。 父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現在同一個購物籃的現象。 如果這個年輕的父親在賣場只能買到兩件商品之一,則他很有可能會放棄購物而到另一家商店, 直到可以一次同時買到啤酒與尿布為止。
當然"啤酒與尿布"的故事必須具有技術方面的支持。1993年美國學者Agrawal提出通過分析購物籃中的商品集合,從而找出商品之間關聯關系的關聯算法,并根據商品之間的關系,找出客戶的購買行為。艾格拉沃從數學及計算機算法角度提 出了商品關聯關系的計算方法–Aprior算法。沃爾瑪從上個世紀 90 年代嘗試將 Aprior 算 法引入到 POS機數據分析中,并獲得了成功,于是產生了"啤酒與尿布"的故事。
案例二:總統選舉投票可視化圖表
案例揭示
通過對大量數據的有效分析,可以發現數據背后存在的事實真相與規律,然后利用可視化試圖手段,顯示出數據背后的規律,從而達到方便觀察和分析效果,可為后期的發展指引準確的方向。? 數據分析與可視化
商業數據可視化分析的流程和步驟
明確分析目的
明確分析目的是最關鍵的步驟。分析數據要發現隱藏在數據背后的不易發覺的真相,為后期的決策起到預測與協助決策的作用。
數據分析之后的一切工作都是圍繞著這個目的來展開的,只有明確我們的分析目的,明確我們要解決什么問題,我們才能有針對性的去收集數據,解決問題。
數據獲取
獲取數據的途徑:內部數據獲取和外部數據獲取。
數據清洗
數據清洗是對數據進行重新審查和校驗的過程,目的在于刪除重復信息、糾正存在的錯誤,并提供數據一致性。數據清洗從名字上也看的出就是把“臟”的“洗掉”,指發現并糾正數據文件中可識別的錯誤的最后一道程序,包括檢查數據一致性,處理無效值和缺失值等。因為數據倉庫中的數據是面向某一主題的數據的集合,這些數據從多個業務系統中抽取而來而且包含歷史數據,這樣就避免不了有的數據是錯誤數據、有的數據相互之間有沖突,這些錯誤的或有沖突的數據顯然是我們不想要的,稱為“臟數據”。
與數據源直接對接,是數據分析過程中最為繁瑣和最耗時的一步,它幾乎占用了數據分析的60%~80%的時間,做好數據清洗工作,形成好的數據源是數據分析的重要前提。數據清洗整個數據分析過程中最繁瑣和耗時的工作。
清洗路徑:
- 去除/補全有效缺失的數據
- 去除/修改格式和內容錯誤的數據
- 去除/修改邏輯錯誤的數據
- 去除不需要的數據
數據加工建模
數據建模指的是對現實世界各類數據的抽象組織。確定數據庫需管轄的范圍、數據的組織形式等直至轉化成現實的數據庫。將經過系統分析后抽象出來的概念模型轉化為物理模型。
數據建模可以評估和度量組織如何管理進出數據庫管理系統的數據流。由于它負責為數據創建所需的空間,因此數據建模是大數據項目中最重要的部分之一。數據建模為數據構建空間.并考慮與數據所在環境相關的因素。簡而言之,數據建模是對組織內數據的管理。
數據建模還決定了數據應該如何處理,數據元之間如何連接,以及如何生成數據和未來數據將講述什么故事。
考慮到數據建模對組織的影響,需要在數據收集過程的早期做出關于數據建模的決策。由組織決定每個數據集將講述什么故事,為了讓數據講述完美的故事,需要對其進行建模以達到完美。
數據加工建模是數據分析過程中最具有技術含量的核心工作。建模加工分析是最能考察一個數據分析師的分析能力的步驟,對待同一份數據,不同的分析師會有著不同的見解,得出的結果也不盡相同,這不僅需要我們積累業務經驗提高對數字的敏感度,同時也需要我們提高對工具的熟練度
數據可視化
數據可視化是一種關于數據視覺的表現形式技術。其中,這種數據的視覺表現形式被定義為:一種以某種概要形式抽提出來的信息,包括相應信息單位的各種屬性和變量。
狹義上的數據可視化指的是將數據用統計圖表方式呈現,用于傳遞信息。廣義上的數據可視化是信息可視化其中一類,因為信息是包含了:數字和非數字的。從原詞的解釋來講:數據可視化重點突出的是”可視化”。整體而言,可視化就是數據、信息以及科學等等多個領域圖示化技術的統稱。
數據可視化的目的就是直觀地展現數據,例如讓花費數小時甚至更久才能歸納的數據量,轉化成一眼就能讀懂的指標:通過加減乘除、各類公式權衡計算得到的兩組數據差異,在圖中通過顏色區分、長短大小的不同表現即能直觀的形成對比;數據可視化是一個溝通復雜信息的強大武器。通過可視化,我們的大腦能更好地抓取和保存有效信息,增加對信息的印象。但如果數據可視化做的較弱,反而會帶來負面效果;錯誤的表達往往會損害數據的傳播,曲解和誤導用戶。
所以更需要我們多維的展現數據,而不僅僅是單一層面的數據展現。
數據可視化幫助我們更加直觀、清楚的理解數據內在的含義,分析出其存在的規律,但我們需要遵循一條原則是:可視化的目的是讓我們能更加容易的理解數據,因此,并不是越復雜的圖形就越好。
- 研究對象及其特點:包括空間、非空間等各種類型的大數據。
- 研究目的:將無意義的數據以含義豐富的形式表現出來,便于人們理解或提供啟發、挖掘規律的可能。
- 主要技術及表達方式:計算機圖形、圖像
- 交互類型:人機交互
發布報告
在實際項目中,最終需要對數據的分析與生成的可視化圖形撰寫書面報告。報告的大致格式可以為:報告標題、文檔目錄、分析背景、項目說明、分析思路、結論建議、分析主體和附錄。
進行匯報時,為了讓報告更吸引人,絕大多數可視化故事會以某類問題作為開場,引導匯報對象進入某個主題或者場景中,在該主題或場景中,數據所蘊含的意義最為豐富。這種引導方式可以是顯式的,也可以是隱式的,但是他的場景必須清晰明確。作為開場白的問題包含來該故事的前提和引言。
數據分析報告主要有三個方面的作用,即展示分析結果、驗證分析質量,以及為決策者提供參考依據。
數據分析報告的原則:
- 規范性:數據分析報告中所使用的名詞術語一定要規范,標準統一, 前后一致。要與業內公認的術語一致。
- 重要性:數據分析報告一定要體現數據分析的重點,在各項數據分析中,應該重點選取關鍵指標,科學專業進行分析,此外,針對同類問題, 其分析結果也應當按照問題重要性的高低來分級闡述。
- 謹慎性:數據分析報告的編制過程一定要謹慎,基礎數據必須真實、完整,分析過程必須科學、合理,分析結果要可靠,內容要實事求是。
- 創新性:當今科學技術的發展可謂日新月異,許多科學家也都提出各種新的研究模型或者分析方法。數據分析報告需要適時地引入這些內容,一 方面可以用實際結果來驗證或改進它們,另一方面也可以讓更多的人了解到全新的科研成果,使其發揚光大。
商業數據可視化分析的優點
可以更加直觀的參考數據
對于用戶來說并不關心數據的采集以及計算方式等,直接給出用戶想要的數據并且以最簡單的視圖呈現出來才是最實用的。
可以幫助用戶使用數據
—直以來數據都是存在的,也同時被人們使用,比如很多企業都會收集數據以表格的形式來呈現,而靜態繁項的數據往往讓用戶的使用體驗降低,很多人看到密密麻麻的數據就開始頭痛,而數據可視化是動態的,直接提供用戶需要的數據,而不是囫圇吞棗般都呈現出來。
可以更好的尋找關系
比如使用同樣的數據可以找出某個數據y與全部的數據變化以及局部的數據變化,而當這些數據以最簡單的方式呈現出來之后,我們還可以看到全部和局部的關系,而這也是使用數據可視化工具的好處之一。
總之:數據可視化在數據分析中發揮著重要的作用。
一方面,人腦對視覺信息的處理要比書面信息容易得多。使用圖表來總結復雜的數據,可以確保對關系的理解要比那些混亂的報告或電了表格更快。所以說,數據可視化是一種非常清晰的溝通方式,使業務領導者能夠更快地理解和處理他們的信息。
另一方面,可以用建設性方式討論結果。一般來說,當我們向高級管理人員提交許多業務報告的時候,都是規范化的文檔,這些文檔經常被靜態表格和各種圖表類型所夸大。也正是因為它制作的太過于詳細了,以致于那些高管人員也沒辦法記住這些內容,因此對于他們來說是不需要看到太詳細的信息。而使用可視化的工具報告就可以使我們能夠用一些簡短的圖形就能體現那些復雜信息,甚至單個圖形也能做到。決策者可以通過交互元素,輕松地解釋各種不同的數據源。豐富并有意義的圖形有助于讓忙碌的主管和業務伙伴了解問題和對未來計劃進行決策。
商業數據可視化分析常用工具
EXCEL
Microsoft Excel 是Microsoft 為使用Windows 和Apple Macintosh 操作系統的電腦編寫的一款電子表格軟件。直觀的界面、出色的計算功能和圖表工具,再加上成功的市場營銷,使Excel 成為最流行的個人計算機數據處理軟件。
Excel 還是處理數據的經典工具,即便是在各種高級數據分析軟件大行其道的今天,絕大部分數據分析項目仍然能用 Excel 解決,而且學起來也比較容易。大多數人都在用的功能有:表格格式和SUM/AVERAGE/VLOOKUP 等常用函數,進階的功能有:VBA語言、數組公式、應用技巧與高級函數等。
EXCEL特點
√ 使用熟悉
√ 基本能滿足個人或者中小企業的日常工作要用
× 處理幾十兆或者百萬行數據時,容易出現崩潰或者卡頓
x 數據圖形相對簡單,修改相對而言較復雜
PowerBi
Power BI 是微軟最新的商業智能(BI)概念,它包含了一系列的組件和工具。
Power BI 就是一個數據分析工具,它能實現數據分析的所有流程,包括對數據的獲取、清洗、建模和可視化展示,從而來幫助個人或企業來對數據進行分析,用數據驅動業務,做出正確的決策。
下載網址
下載 | Microsoft Power BI
Power BI 特點
√ 數據處理能力強
√ 軟件更新迭代快,幾乎每月都有更新
√ 軟件免費
√ 可實現交互式多角度分析數據
√ 進行分享,在手機或平板等移動端方便閱讀
Tableau
Tableau Software 致力于幫助人們查看并理解數據。Tableau 幫助任何人快速分析、可視化并分享信息。超過42,000 家客戶通過使用Tableau 在辦公室或隨時隨地快速獲得結果。數以萬計的用戶使用Tableau Public 在博客與網站中分享數據。
Tableau 是桌面系統中比較簡單的商業智能工具軟件,Tableau 沒有強迫用戶編寫自定義代碼,新的控制臺也可完全自定義配置。在控制臺上,不僅能夠監測信息,而且還提供完整的分析能力。Tableau 控制臺靈活,具有高度的動態性。
Tableau 將數據運算與美觀的圖表完美地嫁接在一起。程序比較容易上手,各公司可以用它將大量數據拖放到數字“畫布”上,轉眼間就能創建好各種圖表。這一軟件的理念是,界面上的數據越容易操控,公司對自己在所在業務領域里的所作所為到底是正確還是錯誤,就能了解得越透徹。
下載網址
商業智能和分析軟件 (tableau.com)
SQL
結構化查詢語言是高級的非過程化編程語言,允許用戶在高層數據結構上工作。它不要求用戶指定對數據的存放方法,也不需要用廣了解具體的數據存放方式,所以具有完全不同底層結構的不同數據庫系統。可以使用相同的結構化查詢語言作為數據輸入與管理的接口。結構化查詢語言語句可以嵌套,這使它具有極大的靈活性和強大的功能。
數據分析原理
我們要做好商業數據的可視化分析工作,就需要做好對數據的分析建模工作,而做好數據分析建模的前提就是要真正懂得數據分析的原理。
第一步:對相關的數據表進行分類。根據數據表的信息,整理出維度表。我們對行數據分析都是結合不同的維度來進行分析的。
第二步:建立度量值。整理出維度表后,要建立度量值(就是數據分析時經常說到的指標,如銷售量、銷售額、顧客數量等)
第三步:進行比較。
- 不同維度的同一度量值的比較(現實中95%屬于這一類)。如不同門店某一產品的銷售量的比較。
- 同一維度的兩個不同度量值的比較(該比較類型比較少見)。如分析顧客數量與門店數量的關系。
第四步:發現解決問題。
總結:數據分析的原理就是從獲取的數據中分清楚類別和度量值,然后進行組合比較,最后發現并回答問題。
商業數據可視化分析的現狀和需求
現狀是:財務、人力資源管理、運營、營銷,生產制造相關人員都會和數據打交道,所以數據分析處理應當是現代職業人員應當具備的一項技能。
這是一個用數據說話的時代,也是一個依靠數據競爭的時代。目前世界500強企業中,幾乎所有的公司都建立了數據分析部門。IBM、微軟、Google、阿里巴巴等知名公司都積極投資數據業務,建立數據部門,培養數據分析團隊。各國政府和越來越多的企業意識到數據和信息已經成為企業的智力資產和資源,數據的分析和處理能力正在成為日益倚重的技術手段。
?
總結
以上是生活随笔為你收集整理的商业数据可视化分析基础知识的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从学习2021美赛O奖论文到获得2022
- 下一篇: mysql查询记录总数_MySQL记录总