手把手教你用Python读取Excel
導讀:pandas.read_excel接口用于讀取Excel格式的數(shù)據(jù)文件,由于它使用非常頻繁、功能強大、參數(shù)眾多,因此本文專門做詳細介紹。
作者:李慶輝
來源:大數(shù)據(jù)DT(ID:hzdashuju)
01 語法
pandas.read_excel接口的語法如下:
pd.read_excel(io,?sheet_name=0,?header=0,names=None,?index_col=None,usecols=None,?squeeze=False,dtype=None,?engine=None,converters=None,?true_values=None,false_values=None,?skiprows=None,nrows=None,?na_values=None,keep_default_na=True,?verbose=False,parse_dates=False,?date_parser=None,thousands=None,?comment=None,?skipfooter=0,convert_float=True,?mangle_dupe_cols=True,?**kwds)02 文件內(nèi)容
io為第一個參數(shù),沒有默認值,也不能為空,根據(jù)Python的語法,第一個參數(shù)傳參時可以不寫。可以傳入本地文件名或者遠程文件的URL:
#?字符串、字節(jié)、Excel文件、xlrd.Book實例、路徑對象或者類似文件的對象 #?本地相對路徑 pd.read_excel('data/data.xlsx')?#?注意目錄層級 pd.read_excel('data.xls')?#?如果文件與代碼文件在同一目錄下 #?本地絕對路徑 pd.read_excel('/user/gairuo/data/data.xlsx') #?使用URL pd.read_excel('https://www.gairuo.com/file/data/dataset/team.xlsx')與read_csv一樣,需要注意,Mac和Windows中的路徑寫法不一樣。
03 表格
sheet_name可以指定Excel文件讀取哪個sheet,如果不指定,默認讀取第一個。
#?字符串、整型、列表、None,默認為0 pd.read_excel('tmp.xlsx',?sheet_name=1)?#?第二個sheet pd.read_excel('tmp.xlsx',?sheet_name='總結表')?#?按sheet的名字#?讀取第一個、第二個、名為Sheet5的sheet,返回一個df組成的字典 dfs?=?pd.read_excel('tmp.xlsx',?sheet_name=[0,?1,?"Sheet5"]) dfs?=?pd.read_excel('tmp.xlsx',?sheet_name=None)?#?所有sheet dfs['Sheet5']?#?讀取時按sheet名04 表頭
數(shù)據(jù)的表頭參數(shù)為header,如不指定,默認為第一行。
#?整型、整型組成的列表,默認為?0 pd.read_excel('tmp.xlsx',?header=None)??#?不設表頭 pd.read_excel('tmp.xlsx',?header=2)??#?第三行為表頭 pd.read_excel('tmp.xlsx',?header=[0,?1])??#?兩層表頭,多層索引05 列名
用names指定列名,也就是表頭的名稱,如不指定,默認為表頭的名稱。
#?序列,默認為None pd.read_excel('tmp.xlsx',?names=['姓名',?'年齡',?'成績']) pd.read_excel('tmp.xlsx',?names=c_list)?#?傳入列表變量 #?沒有表頭,需要設置為None pd.read_excel('tmp.xlsx',?header=None,?names=None)06 其他
其他參數(shù)與pandas.read_csv的同名參數(shù)功能一致,如果想使用僅pandas.read_csv有的參數(shù),可以考慮將數(shù)據(jù)保存為CSV文件,因為CSV文件相對通用、讀取數(shù)據(jù)快且處理方法比較豐富。
用Python讀取CSV文件的操作詳解可戳:史上最全!用Pandas讀取CSV,看這篇就夠了。
07 小結
本文介紹了pandas.read_excel相對于pandas.read_csv專有的參數(shù)功能。由于Excel文件在日常工作中較為常用,所以需要熟練掌握Excel的數(shù)據(jù)讀取功能。另外對于一些量比較小的Excel數(shù)據(jù)文件,在做數(shù)據(jù)臨時處理時,可以復制并使用pd.read_clipboard()來讀取,非常方便。
關于作者:李慶輝,數(shù)據(jù)產(chǎn)品專家,某電商公司數(shù)據(jù)產(chǎn)品團隊負責人,擅長通過數(shù)據(jù)治理、數(shù)據(jù)分析、數(shù)據(jù)化運營提升公司的數(shù)據(jù)應用水平。精通Python數(shù)據(jù)科學及Python Web開發(fā),曾獨立開發(fā)公司的自動化數(shù)據(jù)分析平臺,參與教育部“1+X”數(shù)據(jù)分析(Python)職業(yè)技能等級標準評審。中國人工智能學會會員,企業(yè)數(shù)字化、數(shù)據(jù)產(chǎn)品和數(shù)據(jù)分析講師,在個人網(wǎng)站“蓋若”上編寫的技術和產(chǎn)品教程廣受歡迎。
本書摘編自《深入淺出Pandas:利用Python進行數(shù)據(jù)處理與分析》,機械工業(yè)出版社華章公司2021年出版。轉(zhuǎn)載請與我們?nèi)〉檬跈唷?/p>
延伸閱讀《深入淺出Pandas》
點擊上圖了解及購買
轉(zhuǎn)載請聯(lián)系微信:DoctorData
推薦語:這是一本全面覆蓋了Pandas使用者的普遍需求和痛點的著作,基于實用、易學的原則,從功能、使用、原理等多個維度對Pandas做了全方位的詳細講解,既是初學者系統(tǒng)學習Pandas難得的入門書,又是有經(jīng)驗的Python工程師案頭必不可少的查詢手冊。《利用Python進行數(shù)據(jù)分析》學習伴侶,用好Python必備。
劃重點????
干貨直達????
數(shù)據(jù)分析怎么學?我畫了一個導圖,又找到22本書
3個最常見案例詳解DBA日常維護
終于有人把平均數(shù)、中位數(shù)和眾數(shù)講明白了
史上最全!用Pandas讀取CSV,看這篇就夠了
更多精彩????
在公眾號對話框輸入以下關鍵詞
查看更多優(yōu)質(zhì)內(nèi)容!
PPT?|?讀書?|?書單?|?硬核?|?干貨?|?講明白?|?神操作
大數(shù)據(jù)?|?云計算?|?數(shù)據(jù)庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?1024?|?數(shù)學?|?算法?|?數(shù)字孿生
據(jù)統(tǒng)計,99%的大咖都關注了這個公眾號
????
新人創(chuàng)作打卡挑戰(zhàn)賽發(fā)博客就能抽獎!定制產(chǎn)品紅包拿不停!總結
以上是生活随笔為你收集整理的手把手教你用Python读取Excel的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 简析Kubernetes八大重要特性
- 下一篇: 创建字节跳动之前,张一鸣读过哪些硬核技术