python基本统计量_Python中简单统计量的计算
本篇文章給大家帶來的內容是關于Python中簡單統計量的計算,有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。
1、這些操作都要確保已經在電腦中安裝好了Anaconda集成庫,如果安裝好后運行出錯誤,可以將原來電腦中的python卸載重新安裝Anaconda,建議安裝時直接將添加環境變量打勾,否則以后得自己添加環境變量,在Pycharm中的編譯器選擇Anaconda安裝文件夾中的python。在Pycharm中新建一個data文件夾用來存放數據文件。
2.打開Python Console。
3.首先在用python讀取數據,需要先輸入import pandas as pd引入pandas包,再輸入df=pd.read_csv("./data/CityData.csv")讀取數據,最后輸入df顯示數據。
4.分別輸入type(df)和type(df["cid"])可以發現兩種數據類型不同。
5.計算平均值:df.mean()或df["xid"].mean()
6.計算中位數:輸入df.median()或df["yid"].median
7.求四分位數:輸入df.quantile(q=0.25)
8.求眾數:輸入df.mode()或df["xid"].mode()
9.求標準差:輸入df.std()或df["yid"].std()
10.計算方差:df.var()或df["xid"].var()
11.求和:df.sum()或df["xid"].sum()
12.計算偏態系數:df.skew()或df["yid"].skew()
13.計算峰態系數:df.kurt()或df["yid"].kurt()
14.生成正態分布函數,pandas無法直接生成,需要先引入scipyimport scipy.stats as ss,再輸入ss.norm,這時生成的是一個正態分布的對象,我們輸入ss.norm.stats(moments="mvsk")查看一下,mvsk分別代表的是均值、方差、偏態系數、峰態系數。
這時我們可以看到生成四個值,分別對應正態分布的mvsk分別為0、1、0、0。
15.ss.norm.pdf(0.0)表示橫坐標為0時的縱坐標的值。ss.norm.ppf(0.9)表示從負無窮累積到返回值時得到的值為0.9,其中ppf后的值必須在0-1之間。ss.norm.cdf(2)表示從負無窮積分到2時的返回值,ss.norm.rvs(size=10)可以得到10個隨機的符合正態分布的數字。
16.類似的,我們可以分別輸入ss.chi2和ss.t得到卡方分布和T分布。
17.此外我們還可以進行抽樣,輸入df.sample(n=10)從數據中抽取10個樣本,輸入df.sample(frac=0.1)從數據中抽取10%的樣本。
總結
以上是生活随笔為你收集整理的python基本统计量_Python中简单统计量的计算的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python读取usb扫码枪数据_USB
- 下一篇: 德州仪器发布全新 Arm Cortex-