2019b官方手册中文版_数据科学|「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南...
文章作者:機(jī)器之心
責(zé)任編輯:書(shū)生
審核編輯:阿春
微信編輯:玖蓁
本文轉(zhuǎn)載自公眾號(hào) 機(jī)器之心
(ID:almosthuman2014)
原文鏈接:「最全」實(shí)至名歸,NumPy 官方早有中文教程,結(jié)合深度學(xué)習(xí),還有防脫發(fā)指南
作者:機(jī)器之心
編者按
如果說(shuō)Pandas是傳統(tǒng)機(jī)器學(xué)習(xí)的必備模塊,那么Numpy就是深度學(xué)習(xí)的基本功。目前市面上有太多基于Pandas的教程,但是關(guān)于Numpy的教程,在尋找資料的過(guò)程中筆者發(fā)現(xiàn)NumPy 官方早在去年就已出了一個(gè)中文版網(wǎng)站,涵蓋 NumPy 的一切。
在 Github 上一度蟬聯(lián)最流行的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)包 NumPy,已經(jīng)有了非常之系統(tǒng)的中文文檔,回想起當(dāng)初細(xì)啃 NumPy 之時(shí),不少人不得不徘徊于各大搜索引擎及平臺(tái)反復(fù)查找,找到的文檔也許還很不系統(tǒng)。現(xiàn)在,如果有什么和 NumPy 的問(wèn)題,只需要瀏覽這份官方中文文檔就足夠了。它足夠的系統(tǒng)、全面且親民。親民到什么程度呢?網(wǎng)站還獨(dú)一份的配備了「防脫發(fā)指南」。
NumPy 是什么?它是大名鼎鼎的,使用 Python 進(jìn)行科學(xué)計(jì)算的基礎(chǔ)軟件包,是 Python 生態(tài)系統(tǒng)中數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、科學(xué)計(jì)算的主力軍,極大簡(jiǎn)化了向量與矩陣的操作處理。除了計(jì)算外,它還包括了:
- 功能強(qiáng)大的 N 維數(shù)組對(duì)象。
- 精密廣播功能函數(shù)。
- 集成 C/C+和 Fortran 代碼的工具。
- 強(qiáng)大的線性代數(shù)、傅立葉變換和隨機(jī)數(shù)功能
此次中文文檔還強(qiáng)調(diào)了它兩大特性:Ndarray 以及切片和索引,這兩部分所涉及的功能在日常操作中是十分常見(jiàn)的。
- Ndarray:一系列同類(lèi)型數(shù)據(jù)的集合,以 0 下標(biāo)為開(kāi)始進(jìn)行集合中元素的索引。ndarray 對(duì)象是用于存放同類(lèi)型元素的多維數(shù)組。ndarray 中的每個(gè)元素在內(nèi)存中都有相同存儲(chǔ)大小的區(qū)域。
- 切片和索引:ndarray 對(duì)象的內(nèi)容可以通過(guò)索引或切片來(lái)訪問(wèn)和修改,與 Python 中 list 的切片操作一樣。ndarray 數(shù)組可以基于 0 - n 的下標(biāo)進(jìn)行索引,切片對(duì)象可以通過(guò)內(nèi)置的 slice 函數(shù),并設(shè)置 start, stop 及 step 參數(shù)進(jìn)行,從原數(shù)組中切割出一個(gè)新數(shù)組。
官網(wǎng)地址:https://www.NumPy.org.cn
這個(gè)官方中文項(xiàng)目?jī)?nèi)容繁多,文章數(shù)量龐大。機(jī)器之心在這里節(jié)選了一些亮點(diǎn)內(nèi)容,供讀者參考。
教程、文檔應(yīng)有盡有,中文版強(qiáng)調(diào)和深度學(xué)習(xí)聯(lián)系
從原理開(kāi)始,中文版增加理論介紹板塊
這個(gè)開(kāi)源的官方中文版教程可以說(shuō)是非常全面了。它從最基本的理解 NumPy 開(kāi)始,教程層層推進(jìn),直到讓用戶掌握進(jìn)階的使用方法。
從內(nèi)容來(lái)看,中文版不僅僅是官方英文版本的翻譯,還額外增加了「文章」這一欄目。該欄目提供了對(duì) NumPy 背后的矩陣運(yùn)算原理的詳細(xì)解釋,使得使用者「知其然,也知其所以然」。這是英文版教程中沒(méi)有的。
以下為這一部分的目錄,從這里可以看到,這部分內(nèi)容主要介紹 NumPy 的基本理論,以及涉及到其應(yīng)用的理論部分,如數(shù)據(jù)分析、神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),以及在其他代碼庫(kù)中的接口等。
基礎(chǔ)篇
- 理解 NumPy
- NumPy 簡(jiǎn)單入門(mén)教程
- Python NumPy 教程
- 創(chuàng)建 NumPy 數(shù)組的不同方式
- NumPy 中的矩陣和向量
進(jìn)階篇
- NumPy 數(shù)據(jù)分析練習(xí)
- NumPy 神經(jīng)網(wǎng)絡(luò)
- 使用 NumPy 進(jìn)行數(shù)組編程
- NumPy 實(shí)現(xiàn)k均值聚類(lèi)算法
- NumPy 實(shí)現(xiàn)DNC、RNN和LSTM神經(jīng)網(wǎng)絡(luò)算法
其他篇
- OpenCV中的圖像的基本操作
- MinPy:MXNet后端的NumPy接口
我們截取了這些文章的部分內(nèi)容,可以看到,這里不僅僅會(huì)講 NumPy 所實(shí)現(xiàn)的功能,還提供了原理的圖解。
對(duì)于多維數(shù)組的直觀講解(部分),可以看出官方提供了很好的理論解釋和圖示。注意和深度學(xué)習(xí)的聯(lián)系
另一方面,NumPy 中文版教程注意到了深度學(xué)習(xí)近來(lái)的發(fā)展趨勢(shì),因此推出了結(jié)合 NumPy 和百度飛槳框架的深度學(xué)習(xí)教程。可以說(shuō),NumPy 不僅僅只是科學(xué)計(jì)算工具了,而是深度學(xué)習(xí)社區(qū)的重要組成部分。
如下為這一部分的內(nèi)容,可以看到,神經(jīng)網(wǎng)絡(luò)相關(guān)的所有內(nèi)容,包括原理和相關(guān)實(shí)現(xiàn)都涵蓋到了。在這部分還有一個(gè) 7 日的深度學(xué)習(xí)入門(mén)課程,供小白用戶參考。
深度學(xué)習(xí)基礎(chǔ)教程
- 前言
- 線性回歸
- 數(shù)字識(shí)別
- 圖像分類(lèi)
- 詞向量
- 個(gè)性化推薦
- 情感分析
- 語(yǔ)義角色標(biāo)注
- 機(jī)器翻譯
- 生成對(duì)抗網(wǎng)絡(luò)
七日入門(mén)深度學(xué)習(xí)(正在更新)
- Day 1:初識(shí)深度學(xué)習(xí)
- Day 1:如何快速入門(mén)深度學(xué)習(xí)?
- Day 2:圖像識(shí)別基礎(chǔ)與實(shí)戰(zhàn)
- Day 3:目標(biāo)檢測(cè)基礎(chǔ)與實(shí)踐(一)
- Day 3:目標(biāo)檢測(cè)實(shí)戰(zhàn)-RCNN算法講解
- Day 3:目標(biāo)檢測(cè)實(shí)戰(zhàn)-YOLOv3檢測(cè)物體
以如下代碼為例,這是一個(gè)線性回歸神經(jīng)網(wǎng)絡(luò)構(gòu)建的代碼部分。可以看到,代碼使用 NumPy 進(jìn)行加載和預(yù)處理,并使用飛槳構(gòu)建數(shù)據(jù)分批等的相關(guān)函數(shù)。
feature_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX','PTRATIO', 'B', 'LSTAT', 'convert' ] feature_num = len(feature_names) data = np.fromfile(filename, sep=' ') # 從文件中讀取原始數(shù)據(jù) data = data.reshape(data.shape[0] // feature_num, feature_num) maximums, minimums, avgs = data.max(axis=0), data.min(axis=0), data.sum(axis=0)/data.shape[0]for i in six.moves.range(feature_num-1):data[:, i] = (data[:, i] - avgs[i]) / (maximums[i] - minimums[i]) # six.moves可以兼容python2和python3ratio = 0.8 # 訓(xùn)練集和驗(yàn)證集的劃分比例 offset = int(data.shape[0]*ratio) train_data = data[:offset] test_data = data[offset:]def reader_creator(train_data): def reader(): for d in train_data: yield d[:-1], d[-1:] return readertrain_reader = paddle.batch(paddle.reader.shuffle(reader_creator(train_data), buf_size=500),batch_size=BATCH_SIZE)test_reader = paddle.batch(paddle.reader.shuffle(reader_creator(test_data), buf_size=500),batch_size=BATCH_SIZE)用戶文檔和參考手冊(cè):覆蓋 NumPy 的一切
當(dāng)然,最核心的部分當(dāng)然是 NumPy 本身的文檔了。中文版中對(duì)用戶的使用文檔和 NumPy 所有 API 都進(jìn)行了翻譯和整理工作,基本上用戶需要的內(nèi)容都可以在這里找到。
用戶文檔目錄如下,這里還貼心地提供了和「競(jìng)品」Matlab 的比較,以及 NumPy 在 C 語(yǔ)言下的 API 使用方法。
- NumPy 介紹
- 快速入門(mén)教程
- NumPy 基礎(chǔ)知識(shí)
- 其他雜項(xiàng)
- 與 Matlab 比較
- 從源代碼構(gòu)建
- 使用 NumPy 的 C-API
從這里可以看到,官方中文版真的是誠(chéng)意滿滿。不僅提供原始文檔的翻譯,還加上了包括深度學(xué)習(xí)教程、其他來(lái)源的功能+原理解讀材料。對(duì)于剛上手 NumPy 的人來(lái)說(shuō),這就是最佳的學(xué)習(xí)教程。不管是自學(xué)也好,還是用于開(kāi)發(fā)也好,都是極好的。
其他資源及文檔
如果讀到這里你還不過(guò)癮?沒(méi)關(guān)系,官網(wǎng)還有相關(guān)配套的文章及視頻,讓你多樣化地保持新鮮感:
另外,獨(dú)有一份的防脫發(fā)指南讓你入坑之時(shí)再無(wú)后顧之憂:
面向開(kāi)發(fā)者還單獨(dú)有一份開(kāi)發(fā)者指南,這是一份詳細(xì)的操作清單,如何合理的配置及使用開(kāi)發(fā)環(huán)境等一系列問(wèn)題都已被包含在內(nèi)。
- NumPy 行為準(zhǔn)則
- Git 教程
- 設(shè)置和使用您的開(kāi)發(fā)環(huán)境
- 開(kāi)發(fā)流程
- NumPy 基準(zhǔn)測(cè)試
- NumPy C 風(fēng)格指南
- 發(fā)布一個(gè)版本
- NumPy 治理
NumPy 的用戶數(shù)量龐大,開(kāi)發(fā)者社區(qū)也非常繁榮。從包括 PyTorch、NumPy 等開(kāi)源工具陸續(xù)推出中文版文檔來(lái)看,中文世界在機(jī)器學(xué)習(xí)領(lǐng)域受到了更大的關(guān)注。
總結(jié)
以上是生活随笔為你收集整理的2019b官方手册中文版_数据科学|「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 机械硬盘低级格式化软件_低级比高级安全?
- 下一篇: robocopy 备份_通过Roboco