简述Python的Numpy,SciPy和Pandas,Matplotlib的区别
Numpy: 基礎(chǔ)的數(shù)學(xué)計算模塊,以矩陣為主,純數(shù)學(xué)。
SciPy: 基于Numpy,提供方法(函數(shù)庫)直接計算結(jié)果,封裝了一些高階抽象和物理模型。比方說做個傅立葉變換,這是純數(shù)學(xué)的,用Numpy;做個濾波器,這屬于信號處理模型了,在Scipy里找。
Pandas: 提供了一套名為DataFrame的數(shù)據(jù)結(jié)構(gòu),適合統(tǒng)計分析中的表結(jié)構(gòu),在上層做數(shù)據(jù)分析,
更簡潔的說:
NumPy:N維數(shù)組容器
SciPy:科學(xué)計算函數(shù)庫
Pandas:表格容器
非數(shù)學(xué)研究,建議直接入手pandas,包含基礎(chǔ)的Numpy方法
Numpy:
來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結(jié)構(gòu)要高效的多,本身是由C語言開發(fā)。這個是很基礎(chǔ)的擴展,其余的擴展都是以此為基礎(chǔ)。數(shù)據(jù)結(jié)構(gòu)為ndarray,一般有三種方式來創(chuàng)建。
Pandas:
基于NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。最具有統(tǒng)計意味的工具包,某些方面優(yōu)于R軟件。數(shù)據(jù)結(jié)構(gòu)有一維的Series,二維的DataFrame(類似于Excel或者SQL中的表,如果深入學(xué)習(xí),會發(fā)現(xiàn)Pandas和SQL相似的地方很多,例如merge函數(shù)),三維的Panel(Pan(el) + da(ta) + s,知道名字的由來了吧)。
學(xué)習(xí)Pandas你要掌握的是:
1.匯總和計算描述統(tǒng)計,處理缺失數(shù)據(jù) ,層次化索引
2.清理、轉(zhuǎn)換、合并、重塑、GroupBy技術(shù)
3.日期和時間數(shù)據(jù)類型及工具(日期處理方便地飛起)
Matplotlib:
Python中最著名的繪圖系統(tǒng),很多其他的繪圖例如seaborn(針對pandas繪圖而來)也是由其封裝而成。
繪制的圖形可以大致按照ggplot的顏色顯示,但是還是感覺很雞肋。但是matplotlib的復(fù)雜給其帶來了很強的定制性。其具有面向?qū)ο蟮姆绞郊癙yplot的經(jīng)典高層封裝。
需要掌握的是:
1.散點圖,折線圖,條形圖,直方圖,餅狀圖,箱形圖的繪制。
2.繪圖的三大系統(tǒng):pyplot,pylab(不推薦),面向?qū)ο?br /> 3.坐標(biāo)軸的調(diào)整,添加文字注釋,區(qū)域填充,及特殊圖形patches的使用
4.金融的同學(xué)注意的是:可以直接調(diào)用Yahoo財經(jīng)數(shù)據(jù)繪圖
Scipy:
方便、易于使用、專為科學(xué)和工程設(shè)計的Python工具包.它包括統(tǒng)計,優(yōu)化,整合,線性代數(shù)模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等等。基本可以代替Matlab,但是使用的話和數(shù)據(jù)處理的關(guān)系不大,數(shù)學(xué)系,或者工程系相對用的多一些。
近期發(fā)現(xiàn)有個statsmodel可以補充scipy.stats,時間序列支持完美
鏈接:https://www.jianshu.com/p/32cb09d84487
總結(jié)
以上是生活随笔為你收集整理的简述Python的Numpy,SciPy和Pandas,Matplotlib的区别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机视觉——百度百科
- 下一篇: Python 学习 —— Numpy 、