datatable修改csv的最后一列
生活随笔
收集整理的這篇文章主要介紹了
datatable修改csv的最后一列
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
代碼如下;
修改列的規則在change_column中,自己根據需要進行修改
思路是把要修改的列挪出來,大幅度減少內存占用,從而提速.
import datatable as dt import time import pandas as pd import numpy as npdef change_column(path):df = pd.read_csv(path)print("-------------文件已經讀入內存----------")df["isFraud"] = np.where(df["isFraud"] ==1, "+", "-")print("-------------數據處理完畢,開始寫入----------")df.to_csv("train_isFraud_final.csv",index=False)folder_path = './' fraud_data= dt.fread(f'{folder_path}step3_train.csv')#讀取文件#------------------備份要移動的列到外面----------------- fraud_data["isFraud"].to_csv("train_isFraud.csv")#------------------刪除已經備份好的這一列----------------- del fraud_data[:,"isFraud"]#------------------修改這一列----------------- change_column("train_isFraud.csv")#------------------append到step3_train.csv的最后一列----------------- isFraud_data=dt.fread(f'{folder_path}train_isFraud_final.csv') fraud_data.cbind(isFraud_data)#append操作 fraud_data.to_csv("train_step4.csv")datatable官方文檔
https://datatable.readthedocs.io/en/latest/using-datatable.html
總結
以上是生活随笔為你收集整理的datatable修改csv的最后一列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: datatable移动一列的位置
- 下一篇: datatable和awk获取列名操作