修改csv某一列
代碼如下:
# np.where(condition, x, y) # 滿足條件(condition),輸出x,不滿足輸出y。 import time import pandas as pd import numpy as np def change_p(path):df = pd.read_csv(path)print("-------------文件已經讀入內存----------")df["isFraud"] = np.where(df["isFraud"] ==1, "+", "-")print("-------------數據處理完畢,開始寫入----------")df.to_csv("fraud_delte_DeviceType2.csv",index=False) if __name__ == '__main__':start=time.time()path="fraud_delte_DeviceType.csv"change_p(path)end=time.time()print("總共耗時",end-start)上面代碼的意思是如果該列的數值=1,就改成+,否則就改成-
比較惡心的是沒有進度條,怎么辦呢?
直接看fraud_delte_DeviceType2.csv的大小變化就知道進度了
性能:
50w數據用以上代碼處理總共耗時 170.94927763938904s
?
總結
- 上一篇: pandas输出csv某一列的数据
- 下一篇: datatable移动一列的位置