计算机视觉与深度学习,看这本书就够了
開始機(jī)器學(xué)習(xí)知識(shí)的學(xué)習(xí),差不多已經(jīng)有一年的時(shí)間。這期間看了很多教材和書籍,有些深入進(jìn)行了學(xué)習(xí),有些書(比如深度學(xué)習(xí)領(lǐng)域著名的西瓜書)則看不下去。機(jī)器學(xué)習(xí)其實(shí)也有許多方向,比如強(qiáng)化學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等等,如果每個(gè)方向都學(xué)習(xí)的話,普通人也沒有那么多精力。
在經(jīng)過一年的泛泛的學(xué)習(xí)之后,決定將計(jì)算機(jī)視覺作為我的主攻方向,主要也是因?yàn)槲覍?duì)計(jì)算機(jī)圖像這個(gè)領(lǐng)域比較感興趣。在網(wǎng)上搜索了一些資料,以及推薦書單后,決定選擇《Deep Learning for Computer Vision with Python》作為認(rèn)真研讀的一本書,目前已經(jīng)差不多看完了第一部: Starter Bundle,覺得非常不錯(cuò),推薦給有志于從事計(jì)算機(jī)視覺方向的朋友。
首先需要說明的是,這本書目前還沒有中文版,好在作者沒有使用生僻的詞匯,用詞遣句也比較簡(jiǎn)練,配合著Google翻譯,讀起來還算順利。在公眾號(hào)后臺(tái)回復(fù)“計(jì)算機(jī)視覺”可以下載本書的電子版。
由計(jì)算機(jī)視覺專家Adrian Rosebrock編寫的《Deep Learning for Computer Vision with Python》被評(píng)為當(dāng)前最好的深度學(xué)習(xí)和計(jì)算機(jī)視覺資源之一。Google 的 AI 研究員和 Keras 庫的作者Francois Chollet對(duì)于本書做出過這樣的評(píng)價(jià):
??? 這是一部關(guān)于計(jì)算機(jī)視覺的卓越的、深入且實(shí)用的深度學(xué)習(xí)實(shí)踐作品。我認(rèn)為它非常易讀易懂:書中的解釋清晰而又詳細(xì)。在書中你能夠找到許多在其他書籍或大學(xué)課程中難以見到的實(shí)用的建議。對(duì)于從業(yè)者和初學(xué)者,我強(qiáng)烈推薦這本書。
這本書分為三個(gè)bundle:
??? Starter Bundle - 這部分的內(nèi)容比較基礎(chǔ),包括從零開始實(shí)現(xiàn)回歸算法、深度神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)。對(duì)于完全沒有機(jī)器學(xué)習(xí)基礎(chǔ)的人而言,可以從實(shí)例中學(xué)習(xí)到深度學(xué)習(xí)的基礎(chǔ)知識(shí)。如果有一定的深度學(xué)習(xí)知識(shí)背景,也可以學(xué)習(xí)到在實(shí)際中如果應(yīng)用深度學(xué)習(xí)(主要是圖像分類),加深對(duì)深度學(xué)習(xí)的理解。
??? Practition Bundle - 這部分的內(nèi)容在Starter Bundle基礎(chǔ)上更進(jìn)一步,探討的是在實(shí)際中可能會(huì)碰到的問題及解決之道,比如提高識(shí)別的精度、模型選擇、超大數(shù)據(jù)集,最后引入了幾個(gè)大型的、復(fù)雜的網(wǎng)絡(luò)模型。
??? ImageNet Bundle - 這部分更多的關(guān)注于實(shí)戰(zhàn),前半部分是在ImageNet數(shù)據(jù)集上訓(xùn)練各種復(fù)雜的網(wǎng)絡(luò),后半部分則是解決實(shí)際生活中的問題,包括表情檢測(cè)、車輛識(shí)別、年齡預(yù)測(cè)等等。完成這部分的學(xué)習(xí)之后,想必你的實(shí)戰(zhàn)能力會(huì)提高一大截。
如果你對(duì)在計(jì)算機(jī)視覺(圖像分類、對(duì)象檢測(cè)、圖像理解等)中應(yīng)用深度學(xué)習(xí)有興趣,那這本書再好不過了。
在這本書中,你將能夠:
??? 理論和實(shí)踐并重地學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)內(nèi)容
??? 學(xué)習(xí)先進(jìn)的深度學(xué)習(xí)技術(shù),包括對(duì)象檢測(cè)、多GPU訓(xùn)練、遷移學(xué)習(xí)以及生成對(duì)抗網(wǎng)絡(luò)等
??? 復(fù)現(xiàn)最前沿的論文成果,包括ResNet、 SqueezeNet、 VGGNet以及其他存在于 ImageNet 數(shù)據(jù)集中的成果
這本書最吸引我的地方在于,書籍兼顧了理論和實(shí)踐兩者之間的平衡,對(duì)每一個(gè)深度學(xué)習(xí)理論,都會(huì)有一個(gè)關(guān)聯(lián)的Python實(shí)現(xiàn)來幫助你鞏固對(duì)其的理解和學(xué)到的知識(shí)。書中有詳細(xì)的代碼,且代碼都有比較詳細(xì)的說明,對(duì)Engineer非常友好。
我在學(xué)習(xí)的過程中,都會(huì)嘗試著輸入代碼,加深對(duì)代碼的理解。你可以訪問:https://github.com/mogoweb/aiexamples獲得我的代碼。
在公眾號(hào)后臺(tái)回復(fù)“計(jì)算機(jī)視覺”可以下載本書的電子版。
---------------------
原文:https://blog.csdn.net/mogoweb/article/details/86484985
總結(jié)
以上是生活随笔為你收集整理的计算机视觉与深度学习,看这本书就够了的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于标准C语言的数字图像处理基本框架(转
- 下一篇: OpenCV3编程入门(毛星云)之基于O