python处理excel文件(xls和xlsx)
一、xlrd和xlwt
使用之前需要需要先安裝,windows上如果直接在cmd中運(yùn)行python則需要先執(zhí)行pip3 install xlrd和pip3 install xlwt,如果使用pycharm則需要在項(xiàng)目的解釋器中安裝這兩個(gè)模塊,File-Settings-Project:layout-Project Interpreter,點(diǎn)擊右側(cè)界面的+號(hào),然后搜索xlrd和xlwt,然后點(diǎn)擊Install Package進(jìn)行安裝。
?
對(duì)于excel來(lái)說(shuō),整個(gè)excel文件稱為工作簿,工作簿中的每個(gè)頁(yè)稱為工作表,工作表又由單元格組成。
對(duì)于xlrd和xlwt,行數(shù)和列數(shù)從0開始,單元格的行和列也從0開始,例如sheet.row_values(2)表示第三行的內(nèi)容,sheet.cell(1,2).value表示第二行第三列單元格的內(nèi)容。
1.xlrd模塊讀取excel文件
使用xlrd模塊之前需要先導(dǎo)入import xlrd,xlrd模塊既可讀取xls文件也可讀取xlsx文件。
獲取工作簿對(duì)象:book = xlrd.open_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheet_names(),結(jié)果為列表
根據(jù)索引獲取工作表對(duì)象:sheet = book.sheet_by_index(i)
根據(jù)名稱獲取工作表對(duì)象:sheet = book.sheet_by_name('工作表名稱')
獲取工作表行數(shù):rows = sheet.nrows
獲取工作表列數(shù):cols = sheet.ncols
獲取工作表某一行的內(nèi)容:row =?sheet.row_values(i) ,結(jié)果為列表? ?【sheet.row(i),列表】
獲取工作表某一列的內(nèi)容:col =?sheet.col_values(i)? 結(jié)果為列表? ?【sheet.col(i),列表】
獲取工作表某一單元格的內(nèi)容:cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,結(jié)果為字符串或數(shù)值? ? 【sheet.cell(0,0),xlrd.sheet.Cell對(duì)象】
示例:假設(shè)在py執(zhí)行文件同層目錄下有一fruit.xls文件,有三個(gè)sheet頁(yè)Sheet1、Sheet2、Sheet3,其中Sheet1內(nèi)容如下:
?
import xlrd book = xlrd.open_workbook('fruit.xls') print('sheet頁(yè)名稱:',book.sheet_names()) sheet = book.sheet_by_index(0) rows = sheet.nrows cols = sheet.ncols print('該工作表有%d行,%d列.'%(rows,cols)) print('第三行內(nèi)容為:',sheet.row_values(2)) print('第二列內(nèi)容為%s,數(shù)據(jù)類型為%s.'%(sheet.col_values(1),type(sheet.col_values(1)))) print('第二列內(nèi)容為%s,數(shù)據(jù)類型為%s.'%(sheet.col(1),type(sheet.col(1)))) print('第二行第二列的單元格內(nèi)容為:',sheet.cell_value(1,1)) print('第三行第二列的單元格內(nèi)容為:',sheet.cell(2,1).value) print('第五行第三列的單元格內(nèi)容為:',sheet.row(4)[2].value) print('第五行第三列的單元格內(nèi)容為%s,數(shù)據(jù)類型為%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value))) print('第五行第三列的單元格內(nèi)容為%s,數(shù)據(jù)類型為%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 執(zhí)行結(jié)果 # sheet頁(yè)名稱: ['Sheet1', 'Sheet2', 'Sheet3'] # 該工作表有5行,3列. # 第三行內(nèi)容為: ['梨', 3.5, 130.0] # 第二列內(nèi)容為['單價(jià)/元', 8.0, 3.5, 4.5, 3.8],數(shù)據(jù)類型為<class 'list'>. # 第二列內(nèi)容為[text:'單價(jià)/元', number:8.0, number:3.5, number:4.5, number:3.8],數(shù)據(jù)類型為<class 'list'>. # 第二行第二列的單元格內(nèi)容為: 8.0 # 第三行第二列的單元格內(nèi)容為: 3.5 # 第五行第三列的單元格內(nèi)容為: 300.0 # 第五行第三列的單元格內(nèi)容為300.0,數(shù)據(jù)類型為<class 'float'> # 第五行第三列的單元格內(nèi)容為number:300.0,數(shù)據(jù)類型為<class 'xlrd.sheet.Cell'> xlrd讀取excel示例?
可以看出,通過(guò)sheet.row(i)、sheet.col(i)也可以獲取行或列的內(nèi)容,并且結(jié)果也是一個(gè)列表,但是列表中的每一項(xiàng)類似字典的鍵值對(duì),形式為數(shù)據(jù)類型:值
而sheet.cell(0,0)獲取單元格內(nèi)容,結(jié)果是一個(gè)鍵值對(duì),并且是一個(gè)xlrd.sheet.Cell對(duì)象。
?
2.xlwt寫入excel文件
使用xlwt模塊之前需要先導(dǎo)入import xlwt,xlwt模塊只能寫xls文件,不能寫xlsx文件(寫xlsx程序不會(huì)報(bào)錯(cuò),但最后文件無(wú)法直接打開,會(huì)報(bào)錯(cuò))。
創(chuàng)建工作簿:book = xlwt.Workbook(),如果寫入中文為亂碼,可添加參數(shù)encoding = 'utf-8'
創(chuàng)建工作表:sheet = book.add_sheet('Sheet1')
向單元格寫入內(nèi)容:sheet.write(m,n,'內(nèi)容1')、sheet.write(x,y,'內(nèi)容2')
保存工作簿:book.save('excel文件名稱'),默認(rèn)保存在py文件相同路徑下,如果該路徑下有相同文件,會(huì)被新創(chuàng)建的文件覆蓋,即xlwt不能修改文件。
import xlwt book = xlwt.Workbook() sheet = book.add_sheet('Sheet1') sheet.write(0,0,'hello') sheet.write(1,0,'你好') book.save('hello.xls') xlwt創(chuàng)建并寫入excel示例?
逐個(gè)單元格寫入excel比較麻煩,可以按行或者列寫入。
import xlwt proj = ['名稱','單價(jià)/元','庫(kù)存/kg'] fruit = ['蘋果','梨','香蕉','橘子'] price = [8,3.5,4.5,3.8] storage = [150,130,100,300] book = xlwt.Workbook() sheet = book.add_sheet('Sheet1') for i in range(0,len(proj)):sheet.write(0,i,proj[i]) #按行插入行標(biāo)題 for i in range(0,len(fruit)):sheet.write(i+1,0,fruit[i]) #插入第一列水果名稱 for i in range(0,len(price)):sheet.write(i+1,1,price[i]) #插入第二列單價(jià) for i in range(0,len(storage)):sheet.write(i+1,2,storage[i]) #插入第三列庫(kù)存 book.save('fruit2.xls') xlwt逐行或列寫入excel?
二、openpyxl模塊
openpyxl模塊可實(shí)現(xiàn)對(duì)excel文件的讀、寫和修改,只能處理xlsx文件,不能處理xls文件。使用openpyxl模塊之前同樣需要先安裝該模塊,再導(dǎo)入 import openpyxl。
對(duì)于openpyxl,行數(shù)和列數(shù)都從1開始,單元格的行和列也從0開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內(nèi)容
1.openpyxl讀取excel文件
獲取工作簿對(duì)象:book = openpyxl.load_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheetnames
獲取工作表對(duì)象:sheet1 = book.worksheets[n]、sheet2 = book['工作表名稱']、sheet3 = book[book.sheetnames[n]]
獲取工作表名稱:title = sheet1.title
獲取工作表行數(shù):rows = sheet1.max_row
獲取工作表列數(shù):cols = sheet1.max_column
獲取某一單元格內(nèi)容:cell =?sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value
假設(shè)有一fruit2.xlsx,除后綴名其他與上述fruit.xls完全一樣
import openpyxl book = openpyxl.load_workbook('fruit2.xlsx') print('所有sheet頁(yè)名稱:',book.sheetnames) sheet = book.worksheets[0] sheet2 = book['Sheet1'] sheet3 = book[book.sheetnames[0]] print('工作表名稱:',sheet3.title) rows = sheet.max_row cols = sheet.max_column print('該工作表有%d行,%d列.'%(rows,cols))# 執(zhí)行結(jié)果 # 所有sheet頁(yè)名稱: ['Sheet1', 'Sheet2', 'Sheet3'] # 工作表名稱: Sheet1 # 該工作表有5行,3列. openpyxl讀取excel示例?
2.行和列生成器
對(duì)于xlrd模塊來(lái)說(shuō),可直接通過(guò)sheet.row[i]和sheet.col[i]獲取行和列的內(nèi)容,但是對(duì)于openpyxl模塊來(lái)說(shuō),無(wú)法直接獲取某一行或列的內(nèi)容,openpyxl模塊的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通過(guò)循環(huán)或轉(zhuǎn)換成列表、元組的形式得到行或列的值。
print(sheet.rows,sheet.columns) for col in sheet.columns:print(col) for row in sheet.rows:for i in row:print(i.value,end=' ')print()# 執(zhí)行結(jié)果 # <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00> # (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>) # (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>) # (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>) # 名稱 單價(jià)/元 庫(kù)存/kg # 蘋果 8 150 # 梨 3.5 130 # 香蕉 4.5 100 # 橘子 3.8 300 openpyxl的行和列生成器?
如果要獲取某一行或者列的內(nèi)容,可將行、列生成器對(duì)象轉(zhuǎn)換成列表或者元組,再循環(huán)列表或者元組得到內(nèi)容。
前面說(shuō)過(guò)openpyxl模塊的行和列都從1開始,但是由于將生成器轉(zhuǎn)化成了列表list(sheet.rows),而列表的索引從0開始,因此list(sheet.rows)[1]還是表示第二行的內(nèi)容,不是第一行的內(nèi)容。
for i in list(sheet.rows)[1]:print(i.value,end=' ') print() for i in list(sheet.columns)[0]:print(i.value,end=' ')# 執(zhí)行結(jié)果 # 蘋果 8 150 # 名稱 蘋果 梨 香蕉 橘子 獲取某一行或者列的內(nèi)容?
獲取單元格的內(nèi)容
print(sheet.cell(1,2).value) #第一行第二列單元格的內(nèi)容 print(sheet['a2'].value) #使用excel單元格的表示法,字母不區(qū)分大小寫?
3.openpyxl寫excel文件?
創(chuàng)建工作簿:book = openpyxl.Workbook(),如果寫入中文為亂碼,可添加參數(shù)encoding = 'utf-8'
創(chuàng)建工作表:sheet = book.create_sheet('工作表名稱',0),0表示創(chuàng)建的工作表在工作薄最前面
向單元格寫入內(nèi)容:sheet.write(m,n,'內(nèi)容1')、sheet.write(x,y,'內(nèi)容2')
保存工作簿:book.save('excel文件名稱'),默認(rèn)保存在py文件相同路徑下,如果該路徑下有相同文件,會(huì)被新創(chuàng)建的文件覆蓋。
book = openpyxl.Workbook() sheet = book.create_sheet('Sheet1',0) proj = ['名稱','單價(jià)/元','庫(kù)存/kg'] fruit = ['蘋果','香蕉','梨','橘子'] price = [8,3.5,4.5,3.8] storage = [150,130,300,100] for i in range(len(proj)):sheet.cell(1,i+1,proj[i]) for i in range(len(fruit)):sheet.cell(i+2,1,fruit[i]) for i in range(len(price)):sheet.cell(i+2,2,price[i]) for i in range(len(storage)):sheet.cell(i+2,3,storage[i]) book.save('fruit2.xlsx') openpyxl創(chuàng)建和寫excel示例?
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行、列
sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行、第n列
rows = sheet.max_row sheet.insert_rows(rows+2) cherry = ['櫻桃',17,80] for j in cherry:sheet.cell(rows+1,cherry.index(j)+1,j) book.save('fruit2.xlsx') openpyxl在指定位置增加行?
修改單元格內(nèi)容:sheet.cell(m,n) = '內(nèi)容1'或者sheet['B3'] = '內(nèi)容2'?
sheet.cell(3,2,4) sheet['B3'] = 5 book.save('fruit2.xlsx') openpyxl修改單元格的內(nèi)容?
在最后追加行:sheet.append(可迭代對(duì)象)
straberry = ['草莓',20,50] sheet.append(straberry) book.save('fruit2.xlsx') append在最后追加行?
xlrd、xlwt和openpyxl處理excel文件,在寫入文件的時(shí)候不如pandas簡(jiǎn)單,pandas處理excel文件見(jiàn)另外一篇博客https://www.cnblogs.com/Forever77/p/11298173.html
?
轉(zhuǎn)載于:https://www.cnblogs.com/Forever77/p/11135124.html
總結(jié)
以上是生活随笔為你收集整理的python处理excel文件(xls和xlsx)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 梦到牙齿不好是什么预兆
- 下一篇: 29 Python - 字符与编码