python处理excel奖金_60万行的Excel数据,Python轻松处理
1、existing:此次下單日期時間與上次日期時間的距離在N天以內,精確到時間(時分秒)
2、new:即超過N天
整體思路
1、讀取表格的行數據存儲成list,并按照時間列的升序排序。
2、維護一個map(在python里是字典dict),每個用戶 id 作為key,一個二元組(第幾次下單,上一次的日期時間)作為value。
3、遍歷表格行數據的list。判斷客戶 id 是否已經存在于map中,若首次出現,則置該客戶 id 在map中的value為[1,'首次下單'],對應行數據新增的4個數據為[1,'首次下單',該次日期時間與上次日期時間差,'new']。若已經存在,則更新map中對應的value為[原次數+1,該次日期時間],對應行數據新增的4個數據為[原次數+1,上次日期時間,間隔時間,new/existing取決于間隔時間與預設N]。
4、將修改過后的行數據list寫入到Excel工作簿并保存。
讀取表格數據
我們可以用xlrd模塊對Excel文件進行讀取,以便進一步分析處理數據。示例代碼如下:
以上代碼成功輸出前100行的日期則說明已經成功讀取到數據。輸出結果如下:
既然讀取文件沒有問題,進一步瀏覽整個文件發現存在多余的空行和重復的標題行在讀取和轉存中可以用正則匹配過濾掉這些行。
將讀取的行數據轉存到list中,以便進行排序。
將修改后的行數據list寫入Excel表格并保存為xslx格式
結果展示
完整代碼
總結
以上是生活随笔為你收集整理的python处理excel奖金_60万行的Excel数据,Python轻松处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python初学火车座位判断_Pytho
- 下一篇: unity 知道2点计算线段选择角度_影