python运行excel高级筛选怎么用_懂点EXCEL就行!教你利用Python做数据筛选(上)...
前言
Python的數據清洗功能有多厲害,相信不用我說大家都知道了,寥寥幾行代碼便可以把一份雜亂無章的表格給處理的干干凈凈。但是python也是不容易入門的,畢竟編程語言要理解和精通也是要花不少功夫的,所以很多小伙伴紛紛倒在了python的大門外。今天給大家來點干貨,教大家如何利用python對EXCEL數據進行篩選,讓大家可以對python快速入門,并可以領略到python的數據分析魅力。
數據源
我們要先用到一份EXCEL示例文件,在這里我選用了一份電商訂單明細表,數據已脫敏:
EXCEL篩選
如果在EXCEL里進行篩選,我們一般方法是利用EXCEL自身的篩選功能,在彈出的篩選界面里用鼠標進行勾選,例如我們要篩選訂單日期為2010年的和訂單等級為高級的:
類似以上這樣的篩選需求,在EXCEL里就可以實現,當然,除了這個辦法之外,我們也可以通過其他的工具去實現,今天在這里教大家利用ETL+python的組合方法去實現,這兩個工具在數據清洗上非常厲害。大家不要聽到python就打退堂鼓,以下的教程非常淺顯易懂,即使是小白也可以快速入門。在開始教學之前,我們要先用到一個厲害的ETL工具:智分析。
加載數據
由于智分析的ETL是在網頁端上進行處理的,我們首先要做的就是先把本地的數據源導進智分析平臺里,在智分析數據連接的界面里便可以快速把數據源導進來。除了本地的數據文件外,智分析也支持mysql、阿里云等關系型數據庫的連接。打開ETL的界面,把關系數據源的組件拉拽到展示區里,根據存放路徑找到您的數據源:
鼠標右鍵點擊關系數據源的“查看輸出”我們可以對數據源的輸出效果進行預覽:
條件過濾
當完成了數據連接后,接下來就可以利用智分析ETL里自帶的python腳本對數據進行各種處理,我們先把python的組件拉拽到中間的展示區,并與上面的關系數據源進行相連:
點擊python的輸入框進行查看,可以看到這里的輸入框與pycharm等軟件的輸入框基本一樣,只要熟悉python的小伙伴都可以輕松上手,而且系統已經提前輸入了部分腳本,這些代碼是系統默認自帶的,無需自己寫,非常貼心。大家可以看到,提前寫好的腳本主要是調用numpy、pandas這兩個庫以及定義了函數:
根據上述提到的需求,我們目的主要是對訂單日期以及訂單等級這兩個字段進行篩選,我們首先先定義兩個變量cond與cond1,cond在此處調用了pandas的pd.to_datetime()函數,這是pandas的時間處理函數,后面dt.year要篩選的結果就是年份等于2010年。接下來cond1要篩選的條件就是column4=高級,因為兩者是and的關系,寫完這兩句腳本后,還要用&把這兩個條件連接起來。
腳本寫完后,點擊確定,最后我們看一下python腳本執行后的效果,第二列的訂單日期顯示為2010年,訂單等級顯示為高級,只需寫3行代碼,我們的篩選需求已經實現了:
下篇預告
本文從Excel篩選角度介紹簡單的應用,下一篇將講解更復雜的應用,先看看有哪些復雜需求:
·訂單日期篩選2010的訂單
·訂單等級篩選高級
·利潤金額前10的訂單
下篇將解決以上問題,敬請關注
總結
以上是生活随笔為你收集整理的python运行excel高级筛选怎么用_懂点EXCEL就行!教你利用Python做数据筛选(上)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python网页交互引擎_【Kivy P
- 下一篇: mysql web日志_mysql日志管