在Ubuntu 14.04 64bit下用Python搭建数据科学研究环境
大數(shù)據(jù)時(shí)代已經(jīng)來臨,使用python來研究數(shù)據(jù)科學(xué)這門新崛起的學(xué)科已經(jīng)越來越成為一種潮流. 下面是我根據(jù)網(wǎng)上的資料,結(jié)合自己的實(shí)踐整理的文檔, 以備參考.
在Ubuntu下安裝Python模塊通常可以使用apt-get和pip命令。apt-get命令是Ubuntu自帶的包管理命令,而pip則是Python安裝擴(kuò)展模塊的工具,通常pip會(huì)下載擴(kuò)展模塊的源代碼并編譯安裝。
首先將Ubuntu 14.04更新到最新版本,接下來我們需要安裝Python,NumPy/SciPy,matplotlib,pandas,scikit-learn和IPython。我們將從Python開發(fā)包和編譯器開始安裝,編譯器將在編譯所有軟件的時(shí)候用到:
sudo apt-get install python python-dev python-pip
一旦必要的軟件包已安裝,我們就可以通過pip,即Python包管理器,安裝NumPy。pip將下載NumPy的zip包,然后從源代碼編譯。請(qǐng)記住,編譯需要花費(fèi)一些時(shí)間,大概10-20分鐘!
sudo pip install numpy
NumPy安裝完了后,我們需要在繼續(xù)之前檢查它是否可用。在命令行提示符下鍵入python,然后試著導(dǎo)入NumPy。我們將計(jì)算一個(gè)列表的平均值,以測(cè)試NumPy是否可用:
python >>> >>> import numpy >>> from numpy import mean >>> mean([1,2,3]) 2.0 >>> exit()?
現(xiàn)在,我們已成功安裝NumPy,接下來要安裝Python的科學(xué)庫,即SciPy。
sudo pip install scipy
測(cè)試scipy如下
python >>> import scipy >>> from scipy import std >>> std([1,2,3]) 0.81649658092772603 >>> exit()?
現(xiàn)在我們可以安裝matplotlib了.安裝好pip后就可以用下面的命令來查找matplotlib和查看其安裝狀態(tài)
sudo pip search matplotlib
如果還沒有安裝matplotlib, 可以使用下面的命令安裝:
sudo apt-get install libpng-dev libjpeg8-dev libfreetype6-dev
sudo pip install matplotlib?
我們將繼續(xù)安裝數(shù)據(jù)分析和機(jī)器學(xué)習(xí)庫pandas和scikit-learn.
sudo pip install -U scikit-learn
sudo pip install pandas?
我們需要測(cè)試scikit-learn:
python >>> from sklearn import datasets >>> iris = datasets.load_iris() >>> iris >>>?
繼續(xù)測(cè)試pandas:
python >>> from pandas import DataFrame >>> pd = DataFrame() >>> pd Empty DataFrame Columns: [] Index: [] >>> exit()?
最后, 我們需要安裝IPython.這是一個(gè)交互式的Python解釋器,它相比標(biāo)準(zhǔn)的Python控制臺(tái),提供了一個(gè)更精簡(jiǎn)的工作流。在以后的教程中,我將講述IPython在算法交易開發(fā)中的完整用途:
sudo pip install ipython?
說明:
網(wǎng)上說, 也可以使用下面的方法安裝matplotlib
sudo apt-get build-dep python-matplotlib 或者
sudo apt-get build-dep matplotlib
這是可行的,但是會(huì)下載90M解壓后達(dá)到300多M的數(shù)據(jù)包, 從源碼安裝matplotlib, 參見我的實(shí)踐:
參考文獻(xiàn)
[1].http://www.linuxidc.com/Linux/2013-11/92534p5.htm
[2].http://www.th7.cn/system/lin/201407/62903.shtml?? matplotlib安裝
總結(jié)
以上是生活随笔為你收集整理的在Ubuntu 14.04 64bit下用Python搭建数据科学研究环境的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu 14.04 64bit上使
- 下一篇: Pip install: ImportE