机器学习入门数学书籍推荐(部分资源有下载链接)
許多同學(xué)在入門機(jī)器學(xué)習(xí)時(shí)總喜歡從公式推導(dǎo)開(kāi)始看,但又經(jīng)常覺(jué)得很多地方看不懂。這自然就是數(shù)學(xué)基礎(chǔ)不夠?qū)е碌摹km然我們非常推薦以直接調(diào)包的方式入門學(xué)習(xí),但這種方式也僅適合入門。其實(shí)無(wú)論是在機(jī)器學(xué)習(xí)、人工智能(現(xiàn)在廣義中所指的含義),還是在許多較為傳統(tǒng)的IT項(xiàng)目中,數(shù)學(xué)基礎(chǔ)都是必不可少的。本文就簡(jiǎn)單總結(jié)機(jī)器學(xué)習(xí)中需要的數(shù)學(xué)知識(shí)以及對(duì)應(yīng)的學(xué)習(xí)教材。
一、理工科數(shù)學(xué)三大基礎(chǔ)課
一般來(lái)說(shuō),理工科(甚至絕大多數(shù)經(jīng)管類專業(yè))本科都會(huì)開(kāi)設(shè)高等數(shù)學(xué)、線性代數(shù)和概率統(tǒng)計(jì)三門課程。這三門課程的重要性自然也不言而喻。事實(shí)上在大多數(shù)時(shí)候,只要能準(zhǔn)確掌握三門課程的主干知識(shí)并熟練基本的計(jì)算方法,入門機(jī)器學(xué)習(xí)已經(jīng)基本夠用了。這部分全國(guó)采用的教材都很統(tǒng)一,原本的知識(shí)也基本上夠用。
二、數(shù)值計(jì)算的基礎(chǔ)–數(shù)值分析
《數(shù)值分析》這門課程實(shí)際上有一些工科專業(yè)是要開(kāi)的,比如許多學(xué)校的計(jì)算機(jī)專業(yè)就開(kāi)設(shè)了這門課程。數(shù)值分析是從分析運(yùn)算(微、積分)到更為實(shí)際的數(shù)值計(jì)算的重要基礎(chǔ),也是計(jì)算數(shù)學(xué)的主力課程之一。
實(shí)際上目前的機(jī)器學(xué)習(xí)使用的計(jì)算數(shù)學(xué)方法與技術(shù)基本都還停留在近代計(jì)算數(shù)學(xué)的層面,偶爾用一些泛函來(lái)分析分析,但絕大多數(shù)的算法實(shí)際上都還未進(jìn)入現(xiàn)代數(shù)學(xué)的范疇(比如變分法)。
當(dāng)然,數(shù)值分析本身講授的內(nèi)容較為廣泛,而在機(jī)器學(xué)習(xí)中直接會(huì)用到的通常為線性方程組的數(shù)值解法,非線性方程(組)的解法,以及非線性優(yōu)法方法。
數(shù)值分析的教程中,推薦清華大學(xué)李慶揚(yáng)的經(jīng)典教材:
- 李慶揚(yáng)等。數(shù)值分析,清華大學(xué)出版社(或華中科技大學(xué)出版社)。
三、數(shù)值矩陣
從吳恩達(dá)的課程中可以看到,近年來(lái)尤其在深度學(xué)習(xí)領(lǐng)域大量使用向量化編程。當(dāng)然一般而言,利用現(xiàn)有的矩陣計(jì)算庫(kù)完全可以實(shí)現(xiàn)對(duì)理論模型的計(jì)算,其實(shí)許多時(shí)候也并不需要去動(dòng)手寫出詳細(xì)的算法。但如果能對(duì)現(xiàn)有算法有更好的理解,比如算法的精度、時(shí)間復(fù)雜度,各種經(jīng)典方法的優(yōu)缺點(diǎn)等,將在具體應(yīng)用時(shí)大有好處。
數(shù)值矩陣國(guó)內(nèi)的教材很多,就不多說(shuō),重點(diǎn)推薦一本英文教材
- Golub, G. H., Van Loan, C. F., & Computations, M. (1989). Johns Hopkins Univ. Press, Baltimore… 免費(fèi)下載鏈接。
該書(shū)十分系統(tǒng)地講解了各類數(shù)值矩陣的方法,雖然內(nèi)容較多,但各部分的理論推導(dǎo)都十分清楚易懂,對(duì)算法有追求的同學(xué)可以參考。
四、最優(yōu)化理論與方法
優(yōu)化理論是現(xiàn)代機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中的核心內(nèi)容之一。現(xiàn)在各路模型總是提出這樣那樣的loss function,加入這樣那樣的約束等,經(jīng)常把人弄得十分頭疼。尤其一些理論較深的模型(比如SVM),更是看得人心虛。出現(xiàn)這種情況的本質(zhì)就是對(duì)最優(yōu)化理論不夠熟悉。實(shí)際上從優(yōu)化理論本身上來(lái)講,現(xiàn)代機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中用到的方法,尤其是思想上,許多都還是在現(xiàn)有的框架中。因此對(duì)這一課程有較為全面的了解將對(duì)深入理解各類模型有很大的幫助。
當(dāng)然優(yōu)化理論由于應(yīng)用太過(guò)廣泛,市面上有不少優(yōu)秀教材,這里就只推薦一本清華大學(xué)胡運(yùn)權(quán)的教材:
- 胡運(yùn)權(quán),運(yùn)籌學(xué)教程,清華大學(xué)出版社
五、機(jī)器學(xué)習(xí)入門教程
目前通常說(shuō)的機(jī)器學(xué)習(xí)其實(shí)和傳統(tǒng)模式識(shí)別中的絕大多數(shù)內(nèi)容是重合的。除了西瓜書(shū)以外,還有一本模式識(shí)別的經(jīng)典書(shū)目,由清華大學(xué)張學(xué)工教授編寫:
- 張學(xué)工,模式識(shí)別,清華大學(xué)出版社
相比西瓜書(shū),模式識(shí)別的講授方式更為注重過(guò)程和概念本身的理解,當(dāng)然也具有一定的難度。
另外就是目前所有人最大的福利:由AI幾位大牛共同編寫的《Deep learning》。該書(shū)原版本身就完全免費(fèi)開(kāi)源(下載地址)。同時(shí)幾年前也有愛(ài)好者對(duì)其進(jìn)行了翻譯,并且仔細(xì)校對(duì)了幾番,現(xiàn)在的版本已經(jīng)非常完善,所有內(nèi)容都可以完全免費(fèi)下載,甚至包括源文件(下載地址)。
這本書(shū)講授的內(nèi)容十分廣泛,在數(shù)學(xué)部分的解釋也很到位。很明顯可以看出作者是十分想以一種簡(jiǎn)單明了的方式讓讀者更容易接受主要的思想,盡可能少走彎路。
當(dāng)然,要很好地掌握上述基礎(chǔ)內(nèi)容都非易事,成為真正的AI大牛還需要耐心地積累。
參考資料匯總:
- Golub, G. H., Van Loan, C. F., & Computations, M. (1989). Johns Hopkins Univ. Press, Baltimore…。
- 《Deep Learning》英文原版
- 《Deep Learning》中文版
總結(jié)
以上是生活随笔為你收集整理的机器学习入门数学书籍推荐(部分资源有下载链接)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 模糊数学笔记:二、模糊截集与分解定理
- 下一篇: 模糊数学笔记:四、模糊矩阵与模糊关系