开放下载!复旦大学邱锡鹏教授发布教科书《神经网络与深度学习》
點擊“小詹學Python”,“星標”或"置頂"
關鍵時刻,第一時間送達
本文轉載自“機器之心”
邱老師昨天就在知乎發布了這本書:「整本書終于寫完了,雖然還有很多不足。但先告一段落,不然就得無限期拖延下去。感謝眾多熱心網友的意見和建議。全書的內容可以從這里(https://nndl.github.io/)下載。個人能力有限,書中難免有不當和錯誤之處,還望讀者海涵和指正,不勝感激。」
知乎地址:https://zhuanlan.zhihu.com/p/61591812
隨書練習題:https://github.com/nndl/exercise
總體而言,這本書從基礎到研究前沿介紹了深度學習的核心概念與理論。我們不僅能了解到全連接、卷積和循環等基本深度神經網絡網絡,同時還能學習到前沿的?Transformer?等模型,當然所需的數學基礎在附錄也都是有提供的。這本?446?頁的深度學習開放教科書,足夠我們了解?DL?的前前后后。
邱老師是復旦大學計算機科學技術學院的副教授與博士生導師,他目前主要從事自然語言處理、深度學習等方向的研究,在?ACL、EMNLP、AAAI、IJCAI?等計算機學會?A/B?類期刊、會議上發表?50?余篇學術論文。此外,邱老師還是?FudanNLP?的開發者和?FastNLP?的負責人,這兩個開源項目都旨在提供更好的?NLP?工具。
邱老師個人主頁:https://xpqiu.github.io/
如下我們將截取原書部分內容與練習題,希望其能介紹整體結構與大致內容。作為一本優秀的深度學習中文教科書,它真的值得大家下載與閱讀。
前言
本書的寫作目的是使得讀者能夠掌握神經網絡與深度學習技術的基本原?理,知其然還要知其所以然。全書共?15?章。第?1?章是緒論,介紹人工智能、機器?學習、深度學習的概要,使讀者對相關知識進行全面的了解。第?2、3?章介紹了?機器學習的基礎知識。
第?4、5、6?章分別講述三種主要的神經網絡模型:前饋神?經網絡、卷積神經網絡和循環神經網絡。第?7?章介紹神經網絡的優化與正則化方?法。第?8?章介紹神經網絡中的注意力機制和外部記憶。第?9?章簡要介紹了一些無?監督學習方法。第?10?章中介紹一些和模型獨立的機器學習方法:集成學習、協?同學習、自學習、多任務學習、遷移學習、終身學習、小樣本學習、元學習等。這些都是目前深度學習的難點和熱點問題。
第?11?章介紹了概率圖模型的基本概?念,為后面的章節進行鋪墊。第?12?章介紹兩種早期的深度學習模型:玻爾茲曼?機和深度信念網絡。第?13?章介紹最近兩年發展十分迅速的深度生成模型:變分自編碼器和對抗生成網絡。第?14?章介紹了深度強化學習的知識。第?15?章介紹了?應用十分廣泛的序列生成模型。
2015?年復旦大學計算機學院開設了《神經網絡與深度學習》課程,當時還?沒有關于深度學習的系統介紹。講好深度學習并不是一件容易的事,課程涉及?知識點非常多并且比較雜亂,也和實踐結合十分緊密。作為任課教師,我嘗試?將梳理了深度學習的知識體系,并寫了一本講義放在網絡上。
雖然現在看起來?當時對深度學習的理解仍然十分粗淺,且講義存在很多錯誤,但依然受到了很?多熱心網友的反饋和鼓勵。2016?年,華章公司的姚蕾編輯多次拜訪并希望能將?這個講義整理成書。一方面被姚蕾編輯的誠意打動,另一方面也確實感到應該?有一本面向在校學生和相關從業人員的關于深度學習的專門書籍,最終有了正?式出版的意愿。
但我依然低估了寫書的難度,一方面是深度學習的發展十分迅?速,而自己關于深度學習的認知也不斷變化,導致已寫好的內容經常需要修改,另一方面是平時的科研工作十分繁忙,很難抽出大段的時間來靜心寫作,因此?斷斷續續的寫作一直拖延至今。
雖然我自己理想中著書立說的境界是自己在某一個領域有自己的理論體?系,將各式各樣的方法都統一到自己的體系下,并可以容納大多數技術,從新的?角度來重新解釋這些技術。本書顯然還達不到這樣的水平,但希望能結合自身?的經驗,對神經網絡和深度學習的相關知識進行總結、梳理,通過寫書這一途?徑,也使得自己更加能夠深入理解深度學習這一領域,并提高自己的理論水平。
簡要目錄如下:
第一部分 入門篇
第 1 章 緒論
第 2 章 機器學習概述
第 3 章 線性模型
第二部分 基礎模型
第 4 章 前饋神經網絡
第 5 章 卷積神經網絡
第 6 章 循環神經網絡
第 7 章 網絡優化與正則化
第 8 章 注意力機制與外部記憶
第 9 章 無監督學習
第 10 章 模型獨立的學習方式
第三部分 進階模型
第 11 章 概率圖模型
第 12 章 深度信念網絡
第 13 章 深度生成模型
第 14 章 深度強化學習
第 15 章 序列生成模型
附錄 A 線性代數
附錄 B 微積分
附錄 C 數學優化
附錄 D 概率論
附錄 E 信息論
當然實際的書籍目錄會展示更多的細節,讀者可下載原書查閱:
內容
對于內容而言,其實是需要讀者自己體會的,因此我們截取書籍的一小節內容,讀者可拜讀拜讀。
隨書代碼與練習題
除了提供一些示例代碼,例如?PyTorch?或?TensorFlow?的分類回歸問題,邱老師還提供了很多練習題,目前主要有第?3、4、5、6、11、14?章的內容。例如在第六章循環神經網絡中,其練習題為使用循環神經網絡實現唐詩生成任務。
該題目的要求為,補全程序前面的?3?個空和生成詩歌的一段代碼,并以「日?、紅?、山?、夜?、湖、海?、月」詞匯開頭生成詩詞。
該項目提供了對應的數據和部分代碼,我們只需要根據要求填補完全就行了,例如在詩詞生成的?TensorFlow?實現中,我們需要補全的模型架構代碼為:
其它還有很多練習,包括受限玻爾茲曼機、混合高斯模型、黑白棋游戲(強化學習)和卷積神經網絡等等。
總結
以上是生活随笔為你收集整理的开放下载!复旦大学邱锡鹏教授发布教科书《神经网络与深度学习》的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 不会代码,如何搭建一个个人博客?
- 下一篇: 入门 | 如何为你的回归问题选择最合适的