python 分位数计算代码_Python数据分析第十一节 数据运算
數據運算不僅僅是加減乘除的基本運算,還要包括數據的比較,匯總和相關性的計算等等,這一節我們將計算的問題幫大家匯總出來~
目錄
一. 加減乘除運算
二.?比較運算
三. 匯總運算
count 非空值計數
sum 求和
其他(均值,最大最小值,中位數,眾數,方差,標準差,分位數)
四. 相關性運算
一.?加減乘除運算
以下表為例:
加法運算
我們需要生成新的一列“總和”,將四個季度的銷售額相加:
df['總和'] 表示生成新的一列,列名為“總和”
減法運算
我們看一下第二季度和第一季度銷售額的差額,用第二季度減第一季度:
乘法和除法的計算格式也是一樣的,這里就不在具體舉例說明。
二. 比較運算
這里介紹的比較,是指對比表格的兩列大小之間的關系,輸出的值為True 或者False,跟Excel中用IF 函數進行對比效果是一樣的。
舉例:比較是否第二季度銷售額大于等于第一季度
常用對比語句:
# 第一季度大于第二季度df['第一季度']>df['第二季度']# 第一季度不等于第二季度df['第一季度']!=df['第二季度']# 第一季度小于等于第二季度df['第一季度']<=df['第二季度']三. 匯總計算
1. count 非空值計數
在python 中直接調用count()函數,返回的結果為該數據表中每列非空值的個數。具體實現如下所示:
上面是查看每一列非空值的個數,如果想要查看每一行的非空值個數又該怎么辦呢?其實count()方法默認參數是axis=0,即查看每一列。查看每行只需要輸入參數axis=1 即可:
當然,我們也可以查看具體某一列的非空值個數,比如我們想看一下第一季度這一列的非空值個數:
2.?sum 求和
在python中,直接在整個數據表上調用sum()函數,返回的是該數據表每一列的求和結果,例子如下所示:
如果想對每一行進行求和,則需要在sum后面括號中輸入axis=1即可。
當然只對某一列求和也是可以的,比如對第一季度求和,代碼如下:
df['第一季度'].sum()3.?其他
# 求均值df.mean()# 求最大值df.max()#?求最小值df.min()# 求中位數df.median()#?求眾數df.mode()#?求方差df.var()# 求標準差df.std()# 求分位數# 1.求1/4分位數df.quantile(0.25)#?2.求2/4分位數df.quantile(0.5)#?3.求3/4分位數df.quantile(0.75)四.?相關性運算
相關性常用來衡量兩個事物之間的相關程度,我們一般用相關系數來衡量兩者的相關程度,所以相關性計算就是計算相關系數,比較常用的是皮爾遜相關系數。
在python中求相關系數用的是corr()方法,例子如下:
上面算出的是第一季度銷售額和總銷售額的相關性系數
我們還可以利用corr()函數算出兩兩之間的相關性,示例如下:
這樣就生成了相關性系數的矩陣圖!
?
長按關注公眾號
歡迎留言交流
總結
以上是生活随笔為你收集整理的python 分位数计算代码_Python数据分析第十一节 数据运算的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SVN如何回滚到指定版本
- 下一篇: 自适应控制——仿真实验一 用李雅普诺夫稳