pv实现前趋图_Excel 数据透视图实现简易交互式数据面板
美國Ebay公司成立于1995年的圣何塞,是一家可讓全球民眾上網買賣物品的線上拍賣及購物網站。本文將結合Ebay(某類體育用品的)在線拍賣數據,主要使用Excel數據透視表為工具,來實現簡易的交互式數據面板以求對數據進行可視化及分析。
(本文后續將簡稱數據透視表為PV表;簡稱交互式數據面板為Dashboard。)
Ebay拍賣數據來源(原作者已經解釋了采集數據過程中的各種情況,本文不再翻譯。且原作者主要使用R為工具結合機器學習的方法進行數據分析,后續的文章會補充。另,實驗樓有使用python研究同一數據集的相關練習)
http://jaygrossman.com/post/2013/06/10/Predicting-eBay-Auction-Sales-with-Machine-Learning.aspx?jaygrossman.com摩托銷售數據來源
Sample Sales Data?www.kaggle.com探索數據集拿到一個數據集之后,我通常都會思考一些問題。諸如:這個dataset從何而來?了解基本背景后再觀察收錄了哪些變量和數據?其中有多少組數據?時間和空間的跨度是否重要?如果重要的話,跨度是多大呢?......
以這個Ebay Dataset為例:
數據來源于電商銷售,共收錄了258,589組數據,其中銷售時間集中于2011年,包括了"數字信息變量"如:售價以及“文字變量”如:賣家名 等33個變量信息。(通常情況下,數字信息變量(numeric variable)才是數據分析的重點,而文字變量(string variable)通常不是數據分析伊始要關注的重點)
明確需要分析的問題當我了解一個數據集的基本情況后,a)我已經明確知道需要探索哪些要分析的問題;b)我不知道,那么我可以通過Dashboard來輕松地了解數據集的更多基本信息。
使用相關變量及選取合適的分析方法來回答問題本文將用到的分析方法:
- 關鍵績效指標 KPI/ Key Metrics:凸顯關鍵指標
例:判斷是否為"皇冠賣家“(IsHOF)對價格和出價次數的影響?(沒有使用hypothesis test的觀察結果)
賣家“是否有名氣”對商品的平均成交價有明顯影響;同時會導致平均出價次數更多以及更高的首次出價均值。- 趨勢分析法 Trend Analysis:常用折線圖來體現某一變量的發展趨勢
例:摩托銷售數據集中銷售總額與時間的關系(沒有使用hypothesis test的觀察結果)
2003-2005年期間,3-4季度的銷售總額比1-2季度更高。通過前兩年的銷售總額數據,可以預測2005年3-4季度銷售總額將走高。- 對比分析法 Comparison Analysis:常用柱狀圖來進行對比可視化
例:Ebay Dataset中產品范圍與售價的關系圖(沒有使用hypothesis test的觀察結果)
20052-30052范圍的產品平均售價最高,其次是53-10052范圍內的產品- 排名分析法 Rank Analysis:尋找重點/大比重
例:找出Ebay Dataset中銷售量最多的前十款產品的產品sku(category)及其銷售額(沒有使用hypothesis test的觀察結果)
272xx系列(sku)的產品銷售量更高可視化結果并使得面板能“互動”以摩托車銷售數據為例子(因為電腦太燙了帶不動Ebay那個表了-.-):
新人寫東西,求高抬貴手別罵我,大神別吐槽。感恩!歡迎指正!
如有疑問,可去觀看視頻。https://www.bilibili.com/video/av24987555/?p=23
總結
以上是生活随笔為你收集整理的pv实现前趋图_Excel 数据透视图实现简易交互式数据面板的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 擦地机器人修理_自带眼睛还有嘴,喷水式擦
- 下一篇: 两根网线两个路由器一台电脑2根网线如何用