记录一下pandas的分组统计功能,agg
生活随笔
收集整理的這篇文章主要介紹了
记录一下pandas的分组统计功能,agg
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
主要是記錄一下pandas學(xué)習(xí),最近要統(tǒng)計一個數(shù)據(jù),我向以前stata里面有一個很好用的函數(shù),就是tabstat,可以分組統(tǒng)計,并且輸出很多指標(biāo)。
最近處理數(shù)據(jù)我的數(shù)據(jù)是這樣的。
我向按照 valid_num分組,統(tǒng)計avg_stand的均值,標(biāo)準差,最大,最小。最先想到是的stata的tabstat,以前用的很舒服。現(xiàn)在換python了。感覺可以用groupby,但是不知道怎么用。百度了 一下。
group1 = df_avg.groupby('valid_num') group1['avg_stand'].agg(['mean', 'std', 'count'])可以這么用就,輸出一些,基本上是想要的。
可以得到這個結(jié)果。
另外,我需要把 valid_num分一個組,比如分成,
valid_grp = pd.cut(valid_num, [0, 1, 2, 3, 4, 5, 10, 50, 100, 200])分完組之后,在統(tǒng)計,也是可以的。
df_avg['vld_grp'] = valid_grpgroup2 = df_avg.groupby('vld_grp') group2['avg_stand'].agg(['mean', 'std', 'max', 'min', 'median']).to_clipboard()得到結(jié)果是:
總結(jié)
以上是生活随笔為你收集整理的记录一下pandas的分组统计功能,agg的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 蚊子最喜欢叮什么样的人?
- 下一篇: 爬虫 python 爬取php的网页,带