dataframe去重复 python_python – 在DataFrame中组合重复的列
如果我的數據框具有包含相同名稱的列,是否有辦法將具有相同名稱的列與某種功能(即總和)組合在一起?
例如:
In [186]:
df["NY-WEB01"].head()
Out[186]:
NY-WEB01 NY-WEB01
DateTime
2012-10-18 16:00:00 5.6 2.8
2012-10-18 17:00:00 18.6 12.0
2012-10-18 18:00:00 18.4 12.0
2012-10-18 19:00:00 18.2 12.0
2012-10-18 20:00:00 19.2 12.0
我如何通過對列名相同的每一行進行求和來折疊NY-WEB01列(有一堆重復的列,而不僅僅是NY-WEB01)?
解決方法:
我相信這就是你所追求的:
df.groupby(lambda x:x, axis=1).sum()
或者,根據df的長度,快3%到15%之間:
df.groupby(df.columns, axis=1).sum()
編輯:要擴展超出總和,請使用.agg()(.aggregate()的縮寫):
df.groupby(df.columns, axis=1).agg(numpy.max)
標簽:pandas-groupby,python,pandas,dataframe,group-by
來源: https://codeday.me/bug/20190928/1828132.html
總結
以上是生活随笔為你收集整理的dataframe去重复 python_python – 在DataFrame中组合重复的列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 广东电动自行车新规明起实施:进室内充电最
- 下一篇: 曝T3网约车自燃引燃私家车拒赔!平台:我