Python基础教程:pd.drop_duplicates删除重复行的方法
生活随笔
收集整理的這篇文章主要介紹了
Python基础教程:pd.drop_duplicates删除重复行的方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
drop_duplicates 方法實現對數據框 DataFrame 去除特定列的重復行,返回 DataFrame 格式數據。
一、使用語法及參數
使用語法:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)參數:
- subset – 指定特定的列 默認所有列
- keep:{‘first’, ‘last’, False} – 刪除重復項并保留第一次出現的項 默認第一個
keep=False – 表示刪除所有重復項 不保留 - inplace – 是否直接修改原對象
- gnore_index=True – 重置索引 (version 1.0.0 才有這個參數)
二、實操
1.例子一
''' 學習中遇到問題沒人解答?小編創建了一個Python學習交流QQ群:531509025 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' import pandas as pd df = pd.DataFrame({'a':[1,1,2,2],'b':['a','b','a','b']})# 單列 df.drop_duplicates('b', 'first', inplace=True) print(df) '''a b 0 1 a 1 1 b '''# 多列 df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)# 刪除所有重復項 不保留 df.drop_duplicates(subset=['a', 'b'], False)2.例子二
''' 學習中遇到問題沒人解答?小編創建了一個Python學習交流QQ群:531509025 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' # 構建測試數據框 import pandas as pd df = pd.DataFrame({'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],'style': ['cup', 'cup', 'cup', 'pack', 'pack'],'rating': [4, 4, 3.5, 15, 5] })# 默認按所有列去重 df.drop_duplicates()# 指定列 df.drop_duplicates(subset=['brand'])# 保留最后一個重復值 df.drop_duplicates(subset=['brand', 'style'], keep='last')3.刪除重復項后重置索引
# 方法一 df.drop_duplicates(ignore_index=True)# 方法二 df.drop_duplicates().reset_index(drop=True)# 方法三 df.index = range(df.shape[0])總結
以上是生活随笔為你收集整理的Python基础教程:pd.drop_duplicates删除重复行的方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python基础教程:一个单列split
- 下一篇: Python中yield返回生成器的详细