pandas(七) -- 数据分组
生活随笔
收集整理的這篇文章主要介紹了
pandas(七) -- 数据分组
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
數(shù)據(jù)分組官方文檔
分組統(tǒng)計(jì) - groupby功能
- 根據(jù)某些條件將數(shù)據(jù)拆分成組
- 對(duì)每個(gè)組單獨(dú)使用函數(shù)
- 將結(jié)果合并到一個(gè)數(shù)據(jù)結(jié)構(gòu)中
根據(jù)單列或多列分組 .groupby()
分組后的對(duì)象執(zhí)行數(shù)值計(jì)算函數(shù) .sum(),.mean()…
分組后對(duì)象同時(shí)使用多個(gè)函數(shù) --agg()。
參數(shù):
- by 標(biāo)簽(label)或標(biāo)簽列表
- axis 默認(rèn)值為0
- level MultiIndex時(shí)有效
- as_index 布爾型值 默認(rèn)是True – 使用grouped的標(biāo)簽作為index.若為False – grouped的標(biāo)簽仍為標(biāo)簽,會(huì)新生成0~n-1的index.
- sort 是否對(duì)grouped的標(biāo)簽排序
返回的是GroupBy 對(duì)象。通過list(),查看具體內(nèi)容
df
經(jīng)過group方法后,得到的是groupby對(duì)象,是一個(gè)中間數(shù)據(jù),沒有進(jìn)行計(jì)算
- 使用list()將groupby對(duì)象變成列表對(duì)象,可查看具體內(nèi)容
列表是兩個(gè)元組對(duì)象。每個(gè)元組包含‘A’的標(biāo)簽名和相應(yīng)的DataFrame或Series。
[('bar', A B C D1 bar one 0.953897 0.263753 bar three 0.190113 1.011155 bar two 0.941511 -0.51730), ('foo', A B C D0 foo one 1.119704 -0.7421482 foo two 0.643483 -1.1474054 foo two -0.952974 -0.4342416 foo one -0.421435 0.9337917 foo three -0.042118 0.641683)]- get_group()
df.groupby(['A']).get_group('bar')與list(df.groupby('A'))[0][1]相同
- .groups:將分組后的groups轉(zhuǎn)為dict
- 分組計(jì)算函數(shù)方法
- 多函數(shù)計(jì)算:agg()
函數(shù)寫法可以用str,或者np.方法
求均值和求和
可以通過list,dict傳入,當(dāng)用dict時(shí),key名為columns → 更新pandas后會(huì)出現(xiàn)警告
總結(jié)
以上是生活随笔為你收集整理的pandas(七) -- 数据分组的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas(六) -- 合并、连接、去
- 下一篇: pandas 读csv 报错 Unic