pd.DataFrame()快速筛选数据
生活随笔
收集整理的這篇文章主要介紹了
pd.DataFrame()快速筛选数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
快速數據篩選
- 問題場景
- 實現方法
問題場景
當需要對excel數據根據不同的條件進行篩選,可以利用pandas快速實現。例如篩選出一張表格里來自不同網站的數據,每個網站的數據不超過20條。示例如下:
實現方法
import pandas as pddef select_data():raw_df = pd.read_excel('./check_data/原始數據.xlsx')selected_df = pd.DataFrame(columns=raw_df.columns.values) # 直接獲取原DataFrame列標簽website_dict = {}for ind, row in raw_df[:10].iterrows():website_id = row['websiteId']if website_id not in website_dict.keys():website_dict[website_id] = 1selected_df = selected_df.append(row) # 直接添加一條數據elif website_dict[website_id] < 20:website_dict[website_id] += 1selected_df = selected_df.append(row)selected_df.to_excel('./check_data/篩選數據.xlsx')if __name__ == '__main__':select_data()該方法不需要新建DataFrame的列索引,同時在添加數據時直接添加原Series,不需要額外做字段對應,高效而且避免對應出錯。
總結
以上是生活随笔為你收集整理的pd.DataFrame()快速筛选数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Commvault蔡报永:点亮你的暗数据
- 下一篇: 2020年淘宝年货销量数据监控可视化