一、简谈Pandas
最近在寫一本和pandas相關的書,在博客上記錄一下自己的創作過程
寫書的緣由是,前一段時間自己在做人名音譯的項目學習性研究,發現網上在pandas這一塊中文文檔還是是比較欠缺,大多都是對其中部分知識的講解,缺乏系統性的介紹講解,這對許多新人甚至是做過類似工作的人都或多或少造成過困擾。嘗試著寫一寫關于這方面的書籍、教程以供大家相互學習交流,同時也希望通過這個來賺取自己的研究生入學費用。
pandas是大家在Python學習中要掌握的一個必不可少的第三方庫,它是一個開源項目主要由Wes McKinney、Jeff Reback等人編寫而成,最新版本是pandas 0.24.0,附上官網地址。pandas 0.24.0 所支持的Python版本有Python 2.7, 3.5, 3.6, and 3.7.,2019年4月,pandas也將迎來pandas 0.25.0屆時將不再支持Python2。
pandas它的目標是成為所有語言中最強大、最靈活的數據分析與操作開源工具,用它的原話來講就是“it has the broader goal of becoming the most powerful and flexible open source data analysis / manipulation tool available in any language”,目前對于以下類型的數據它的可操作性是比較強:1.表格數據(例如SQL數據表格、Excel數據表中的數據)、2.時間序列、3.帶有行和列標簽的矩陣數據、4.觀測、統計數據集
pandas中包含兩種數據類型(Series和DataFrame),可以將pandas看成低緯度數據的容器,標量數據組成Series,Series組成DataFrame,一層層遞進,將小的容器放到大的容器中,大的容器放到更大的容器中。
總結
以上是生活随笔為你收集整理的一、简谈Pandas的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: selenium教程
- 下一篇: 知识点讲解三:获取重定位后的网址