4段简短代码教你用Python读写Excel
導讀:數據分析將作為一門通用技能,進入越來越多的不同工作中。畢竟“技多不壓身”,掌握數據分析,一方面可以提升自己相應的業務能力,另一方面也可以讓自己建立一種從數據出發的視角,用大數據思維去思考各種問題。
作者:老A
如需轉載請聯系大數據(ID:hzdashuju)
Excel里面的透視表(Pivot Table)確實是做數據分析的必備技能。透視表可以幫你迅速匯總數據,看到各類型數據的直觀特征就像是讓你站在了一個更高的視角上去看你的數據。作為進階,Excel自帶的函數,各種插件,以及VBA也是很好的工具。
但當數據量大到用Excel打開都要好久,電腦打開文件都會死機的時候,這種也就不適合用office工具了,也或者我們想進一步提升能力的時候,需要學習一些hardcore技能,即用編程語言做數據分析。
這里主要有R和Python兩大流派。我個人推薦Python,一方面Python代碼簡單易懂,容易上手;另一方面學習資料超級多。關于Python的學習資料,這里我推薦《利用Python進行數據分析》,這本書涵蓋了利用Python做數據清洗,數據可視化及分析的技能點,可以作一本參考書、工具書,也可以對著書里面的案例進行實操。
受這本書的啟發,我寫了下面是幾個處理Excel的小程序,僅供大家參考學習數據分析和數據從Excel中獲取數據。Python對Excel的讀寫主要有xlrd、xlwt、xlutils、openpyxl、xlsxwriterp這幾個形式。具體的安裝方法可以從網上查一下,然后導入Python中就可以使用了。
1. xlrd主要是用來讀取excel文件
workbook?=?xlrd.open_workbook(u'?Python進行數據分析測試.xls')
sheet_names=?workbook.sheet_names()
for?sheet_name?in?sheet_names:
?sheet2?=?workbook.sheet_by_name(sheet_name)
?print?sheet_name?rows?=?sheet2.row_values(1)?
?cols?=?sheet2.col_values(1)?
?print?rows
?print?cols
2. xlwt主要是用來寫excel文件
wbk?=?xlwt.Workbook()
sheet?=?wbk.add_sheet('sheet?1')
sheet.write(0,1,'test?text')#第0行第一列寫入內容
wbk.save('test.xls')
3. xlutils結合xlrd可以達到修改excel文件目的
from?xlutils.copy?import?copy
workbook?=?xlrd.open_workbook(u'?Python進行數據分析測試.xls')
workbooknew?=?copy(workbook)
ws?=?workbooknew.get_sheet(0)
ws.write(3,?0,?'changed!')
workbooknew.save(u'?Python進行數據分析測試copy.xls')
4. openpyxl可以對excel文件進行讀寫操作
from?openpyxl?import?load_workbook
from?openpyxl.writer.excel?import?ExcelWriter?
workbook_?=?load_workbook(u"?Python進行數據分析測試.xlsx")
sheetnames?=workbook_.get_sheet_names()?
print?sheetnames
sheet?=?workbook_.get_sheet_by_name(sheetnames[0])
print?sheet.cell(row=3,column=3).value
sheet['A1']?=?'47'?
workbook_.save(u"?Python進行數據分析測試新.xlsx")??
wb?=?Workbook()
ws?=?wb.active
ws['A1']?=?4
wb.save("檢索.xlsx")?
最后把《利用Python進行數據分析》這本書的內容再給大家介紹一下,書中含有大量的實踐案例,講解如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數據分析問題。
由于作者Wes McKinney是pandas庫的主要作者,所以這本書也可以作為利用Python實現數據密集型應用的科學計算實踐指南,適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。
將IPython這個交互式Shell作為你的首要開發環境。
學習NumPy(Numerical Python)的基礎和高級知識。
從pandas庫的數據分析工具開始。
利用高性能工具對數據進行加載、清理、轉換、合并以及重塑。
利用matplotlib創建散點圖以及靜態或交互式的可視化結果。
利用pandas的groupby功能對數據集進行切片、切塊和匯總操作。
處理各種各樣的時間序列數據。
通過詳細的案例學習如何解決Web分析、社會科學、金融學以及經濟學等領域的問題。
關于作者:老A,項目管理師,專業興趣研究方向:大數據、計算機軟件、通信工程。個人業余愛好是研究無人機制作,銀元鑒賞與收藏。
本文為「大數據」內容合伙人之「鑒書小分隊」活動讀書筆記,由大數據粉絲原創。
「大數據」內容合伙人之「鑒書小分隊」上線啦!
最近,你都在讀什么書?有哪些心得體會想要跟大家分享?
數據叔最近搞了個大事——聯合優質圖書出版商機械工業出版社華章公司發起鑒書活動。
簡單說就是:你可以免費讀新書,你可以免費讀新書的同時,順手碼一篇讀書筆記就行。詳情請在大數據公眾號后臺對話框回復合伙人查看。
延伸閱讀《利用Python進行數據分析(原書第2版)》
點擊上圖了解及購買
轉載請聯系微信:togo-maruko
推薦語:Python數據分析經典暢銷書全新升級,第1版中文版累計銷售100000冊。針對Python 3.6進行全面修訂和更新,涵蓋新版的pandas、NumPy、IPython和Jupyter。
據統計,99%的大咖都完成了這個神操作
▼
更多精彩
在公眾號后臺對話框輸入以下關鍵詞
查看更多優質內容!
PPT?|?報告?|?讀書?|?書單?|?干貨?
大數據?|?揭秘?|?Python?|?可視化
人工智能?|?機器學習?|?深度學習?|?神經網絡
AI?|?1024?|?段子?|?區塊鏈?|?數學
猜你想看
8個應用案例告訴你,機器學習都能做什么?
從計算機視覺到人臉識別:一文看懂顏色模型、信號與噪聲
什么是Apache Spark?這篇文章帶你從零基礎學起
如果數據有質量,地球將成黑洞?
Q:?最近你在讀哪本書?
歡迎留言與大家分享
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯系:baiyu@hzbook.com
更多精彩,請在后臺點擊“歷史文章”查看
點擊閱讀原文,了解更多
總結
以上是生活随笔為你收集整理的4段简短代码教你用Python读写Excel的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据揭秘中国女性的薪水普遍比男性低,说好
- 下一篇: 盘点数据处理工具,手把手教你做数据清洗和