Pandas简明教程:一、Pandas简介与安装
文章目錄
- 1、Pandas簡(jiǎn)介
- 2、為何要用Pandas?
- 3、知識(shí)、技能與環(huán)境的準(zhǔn)備
- 4、Pandas的安裝與相關(guān)輔助資料
- 本系列教程教程完整目錄:
1、Pandas簡(jiǎn)介
關(guān)于Pandas的介紹在百度上隨便就能搜出一大堆,所以就不多扯些大家都扯的事情。
從項(xiàng)目作者的書的目錄其實(shí)很容易就能看明白它主要能用于做些什么。但我們這里要著重提一句的是:**其實(shí)Pandas能辦到的事情,用Excel全能辦到,而且許多Pandas辦不到的Excel也能辦到。**所以不愿意編程的人建議直接學(xué)EXCEL。完!~
2、為何要用Pandas?
如果非要說用Pandas和Excel之間有什么區(qū)別,那么其實(shí)就是一個(gè)老生常談的問題:GUI與指令操作的區(qū)別!
GUI工具最大的好處就在于容易上手、幾乎無門檻。對(duì)于EXCEL而言,其實(shí)還有一點(diǎn)很重要的是它通常是從最基本的情況開始,在用EXCEL完成任務(wù)時(shí)每個(gè)環(huán)節(jié)的細(xì)節(jié)在自己面前展露無疑,非常有利于自己對(duì)整個(gè)業(yè)務(wù)流程的把握。
那么對(duì)應(yīng)的,用指令操作第一大難點(diǎn)就是它有一定的門檻,最起碼要熟悉一門基本的程序語言。整個(gè)流程相對(duì)而言就不那么透明,在對(duì)業(yè)務(wù)掌握不夠清楚的情況下,要檢查出自己的錯(cuò)誤相對(duì)就比較困難。反之,一旦跨過這個(gè)門檻,指令操作的優(yōu)勢(shì)就體現(xiàn)出來了,其中個(gè)人認(rèn)為最重要的兩點(diǎn)就是:靈活和可重用度高!
不過也要注意,這兩點(diǎn)通常其實(shí)是相輔相成的。單純說靈活性其實(shí)也不見得,比如我想求某一塊數(shù)據(jù)的和、計(jì)數(shù)等,用Excel一拖幾秒鐘手起刀落搞定,但即使熟悉指令的情況下也要去仔細(xì)看一眼這塊數(shù)據(jù)的起、止位置在哪里,結(jié)果等看清楚了這些細(xì)節(jié)還沒敲代碼呢別人都已經(jīng)算完了。
但是,如果我們已經(jīng)保存了模板,那么優(yōu)勢(shì)就來了。還是上面的例子,如果是EXCEL,要求和的數(shù)據(jù)不是一塊而是很多塊,并且還不在一個(gè)表里,同時(shí)老板還告訴你這種情況還會(huì)經(jīng)常發(fā)生變化,那么可能就還需要不停地用篩選數(shù)據(jù)等功能來輔助自己準(zhǔn)確找到想要的區(qū)域。而這種情況下如果篩選的規(guī)則是固定的某種模式,那么用指令的優(yōu)勢(shì)就體現(xiàn)出來了。只要這種模式不發(fā)生巨大變化的情況下,你所有的工作就只需要做一次。
這里就不禁想起一個(gè)小故事。我有個(gè)師兄有一次在某國(guó)企出差做項(xiàng)目(當(dāng)時(shí)應(yīng)該在讀研),當(dāng)時(shí)正值年底,有位高工和他閑聊時(shí)就吐槽說他最近又在忙他每年一度的一件事情,任務(wù)大概是把各種表格里的數(shù)據(jù)這樣那樣處理(其實(shí)不外乎就各部門的各種基礎(chǔ)表格,然后他這里匯總、平均等等一系列操作),然后要匯總成一張大表(當(dāng)然也有若干小表),最后放在他的工作報(bào)告里。聽畢,師兄會(huì)心一笑,起手給他弄個(gè)小程序。大概演示一翻高工大呼內(nèi)行,前后又幫他磨合了幾天過后基本無BUG。然后那位高工就一直指著他這小程序用了10幾年。
上面這種情況,其實(shí)就是最簡(jiǎn)單且典型的一個(gè)辦公自動(dòng)化的應(yīng)用場(chǎng)景。
當(dāng)然,除此之外,還有一些事情是非指令工具難以辦到的了。比如我們要做一些復(fù)雜的操作,把數(shù)據(jù)拿來建立復(fù)雜的機(jī)器學(xué)習(xí)模型,那么除非是特別硬核的老鐵直接上VBA實(shí)現(xiàn)程序來干,絕大多數(shù)凡人還是只能老實(shí)將數(shù)據(jù)導(dǎo)入程序來算。
談到這里,也就回到了這個(gè)系列的初衷:面向競(jìng)賽、研究以及辦公自動(dòng)化。希望通過這一個(gè)簡(jiǎn)單的教程能夠讓有意愿掌握這門技術(shù)的人少走彎路,盡快熟悉和理解這個(gè)框架和許多操作的本質(zhì),為進(jìn)一步進(jìn)行高級(jí)的操作打下基礎(chǔ)。
3、知識(shí)、技能與環(huán)境的準(zhǔn)備
- 知識(shí):Python基礎(chǔ)知識(shí),面向?qū)ο蟮幕局R(shí),對(duì)表格(最好是關(guān)系數(shù)據(jù)庫(kù))有一定的理解
- 技能:Python編程,面向?qū)ο缶幊獭_@里再說一次是為了強(qiáng)調(diào),這兩個(gè)東西。如果還不會(huì)就趕緊再去補(bǔ)一補(bǔ)。具備閱讀通俗的英語文檔的能力(可以借助工具,如GOOGLE翻譯等)。
- 環(huán)境:
- Python的基本環(huán)境(建議直接用Anaconda,簡(jiǎn)單直接方便,懶得折騰)
- IDE。直接看這里:Python入門IDE選擇, Python輕量級(jí)IDE推薦 – Jupyter QTConosle
4、Pandas的安裝與相關(guān)輔助資料
- 安裝方法:
- 官方文檔:推薦穩(wěn)定版主頁
本系列教程教程完整目錄:
一、Pandas簡(jiǎn)介與安裝
二、Pandas基本數(shù)據(jù)結(jié)構(gòu)-DataFrame與Series
三、Pandas文件讀寫
四、Pandas數(shù)據(jù)索引方式
五、Pandas簡(jiǎn)單統(tǒng)計(jì)操作及通用方式
六、Pandas條件查詢
七、Pandas缺失數(shù)據(jù)的處理(數(shù)據(jù)清洗基礎(chǔ))
八、Pandas數(shù)據(jù)透視表
九、表的合并、連接、拼接(數(shù)據(jù)聚合基礎(chǔ))
總結(jié)
以上是生活随笔為你收集整理的Pandas简明教程:一、Pandas简介与安装的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pandas转pivot, groupb
- 下一篇: Pandas简明教程:二、Pandas基