.net bitmap rgb数据_Python商务与经济统计学-数据描述
生活随笔
收集整理的這篇文章主要介紹了
.net bitmap rgb数据_Python商务与经济统计学-数据描述
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
案例2-1、3-1 Pelican 商店
本案例之中主要涉及到Pandas和pyecharts的一些功能,比如利用pandas進行數據篩選,百分比頻數統計,將數據進行分組,分組統計,相關性分析等。另外還涉及到了pyecharts的餅圖,直方圖,散點圖的繪制。
讀入數據
import pandas as pd import numpy as np data = pd.read_csv("PelicanStores.csv") data = data.iloc[:,:8]#過濾數據選擇前8列 data.head()#看一下前五行問題1 主要變量的百分數頻數分布
#Items(購買商品的總件數)百分數頻數分布 Items_percent_frequency_distribution = (pd.value_counts(data["Items"])/np.size(data["Items"]))*100 Items_percent_frequency_distribution#Net Sales(凈銷售額)百分數頻數分布 bins = [0, 50, 100, 150, 200, 250, 300] data["Net Sales Group"] = pd.cut(data["Net Sales"], bins, right=False)#對數據進行分組 Net_Sales_percent_frequency_distribution = (pd.value_counts(data["Net Sales Group"])/np.size(data["Net Sales Group"]))*100 Net_Sales_percent_frequency_distribution#Age(年齡)百分數頻數分布 bins = [20, 30, 40, 50, 60, 70, 80] data["Age_Group"] = pd.cut(data["Age"], bins, right=False) Age_percent_frequency_distribution = (pd.value_counts(data["Age_Group"])/np.size(data["Age_Group"]))*100 Age_percent_frequency_distribution問題2:條形圖或餅形圖,以顯示顧客使用各種付款方式的購物數量
#購物數量有兩個維度,購買商品的總件數和銷售額 M_P_Items_Net_Sales = data.groupby(by=["Method of Payment"])["Items","Net Sales"].agg({"Items":np.sum,"Net Sales":np.sum}) M_P_Items_Net_Sales = M_P_Items_Net_Sales.sort_values(by="Net Sales",ascending=False) M_P_Items_Net_Sales#條形圖 from pyecharts import Bar, Grid x_line = [i for i in M_P_Items_Net_Sales.index.format()] y_line_Items = [i[0] for i in M_P_Items_Net_Sales.values] y_line_NS = [i[1] for i in M_P_Items_Net_Sales.values] bar1 = Bar("Items",title_text_size=26, title_top=10, title_pos=10, width=1000, height=400, background_color="rgb(255,255,255)") bar1.add("", x_line, y_line_Items ,xaxis_label_textsize=12,bar_category_gap='20%') bar2 = Bar("Net Sales",title_text_size=26, title_top=300, title_pos=10, width=1000, height=400, background_color="rgb(255,255,255)") bar2.add("", x_line, y_line_NS ,xaxis_label_textsize=12,bar_category_gap='20%') grid = Grid(height=600, width=1000) grid.add(bar1, grid_bottom="60%") grid.add(bar2, grid_top="60%") grid#餅圖 from pyecharts import Pie pie1 = Pie("Items", title_text_size=26, title_top=10, title_pos=10) pie1.add("", x_line, y_line_Items, is_label_show=True, is_legend_show=False, label_text_size=10,center=[30,50], radius=[0,45]) pie2 = Pie("Net Sales", title_text_size=26, title_top=10, title_pos=500) pie2.add("", x_line, y_line_NS, is_label_show=True, is_legend_show=False, label_text_size=10,legend_orient='vertical',center=[70,50], radius=[0,45]) grid = Grid(height=600, width=1000) grid.add(pie1, grid_left="60%") grid.add(pie2, grid_right="60%") grid問題3:顧客類型(普通或促銷)與凈銷售額的交叉分組表,對相似性與差異性進行評價
data_CN_table = data.pivot_table(values=["Net Sales"], index=["Age_Group"], columns=["Type of Customer"], aggfunc=[np.sum], fill_value=0) data_CN_table- ①促銷所產生的凈銷售額在20至70歲這個區間是比普通顧客要多一些的,其中以50到60歲這個區間較為明顯。
- ②40到50歲,50到60歲這兩個年齡區間的人促銷所產生的凈銷售額相近。
- ③超過30歲的人,隨著年齡的增加,消費能力是一直下降的。
- ④50到70歲的人更傾向只在促銷的時候購買商品。
問題4 探索凈銷售額與顧客年齡關系的散點圖
from pyecharts import Scatter data_NS_Age = data[["Net Sales", "Age"]] x_line_age = [i[1] for i in data_NS_Age.values] y_line_NS = [i[0] for i in data_NS_Age.values] scatter = Scatter() scatter.add("", x_line_age, y_line_NS)問題5 凈銷售額的描述統計量和顧客的各種不同分類的凈銷售額的描述統計量
data["Net Sales"].describe()#凈銷售額的描述統計量data.groupby(["Type of Customer"])["Net Sales"].describe() #分組進行統計描述問題6 關于年齡與凈銷售額之間關系的描述統計量
#相關性分析 data_NS_Age.corr()年齡與凈銷售額之間有一個負的相關關系,證明年齡越大可能所消費的金額更小。
總結
以上是生活随笔為你收集整理的.net bitmap rgb数据_Python商务与经济统计学-数据描述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux 配置DNS正反区域,Linu
- 下一篇: matlab怎么画二维热力图_[原创]D