机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总
??? 《Brief History of Machine Learning》
介紹:這是一篇介紹機(jī)器學(xué)習(xí)歷史的文章,介紹很全面,從感知機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹、SVM、Adaboost到隨機(jī)森林、Deep Learning.
??? 《Deep Learning in Neural Networks: An Overview》
介紹:這是瑞士人工智能實(shí)驗(yàn)室Jurgen Schmidhuber寫的最新版本《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)綜述》本綜述的特點(diǎn)是以時(shí)間排序,從1940年開始講起,到60-80年代,80-90年代,一直講到2000年后及最近幾年的進(jìn)展。涵蓋了deep learning里各種tricks,引用非常全面.
??? 《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》
介紹:這是一份python機(jī)器學(xué)習(xí)庫(kù),如果您是一位python工程師而且想深入的學(xué)習(xí)機(jī)器學(xué)習(xí).那么這篇文章或許能夠幫助到你.
??? 《How to Layout and Manage Your Machine Learning Project》
介紹:這一篇介紹如果設(shè)計(jì)和管理屬于你自己的機(jī)器學(xué)習(xí)項(xiàng)目的文章,里面提供了管理模版、數(shù)據(jù)管理與實(shí)踐方法.
??? 《Machine Learning is Fun!》
介紹:如果你還不知道什么是機(jī)器學(xué)習(xí),或則是剛剛學(xué)習(xí)感覺到很枯燥乏味。那么推薦一讀。這篇文章已經(jīng)被翻譯成中文,如果有興趣可以移步http://blog.jobbole.com/67616/
??? 《R語(yǔ)言參考卡片》
介紹:R語(yǔ)言是機(jī)器學(xué)習(xí)的主要語(yǔ)言,有很多的朋友想學(xué)習(xí)R語(yǔ)言,但是總是忘記一些函數(shù)與關(guān)鍵字的含義。那么這篇文章或許能夠幫助到你
??? 《Choosing a Machine Learning Classifier》
介紹:我該如何選擇機(jī)器學(xué)習(xí)算法,這篇文章比較直觀的比較了Naive Bayes,Logistic Regression,SVM,決策樹等方法的優(yōu)劣,另外討論了樣本大小、Feature與Model權(quán)衡等問題。此外還有已經(jīng)翻譯了的版本:http://www.52ml.net/15063.html
??? 《An Introduction to Deep Learning: From Perceptrons to Deep Networks》
介紹:深度學(xué)習(xí)概述:從感知機(jī)到深度網(wǎng)絡(luò),作者對(duì)于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html
??? 《The LION Way: Machine Learning plus Intelligent Optimization》
??? 介紹:<機(jī)器學(xué)習(xí)與優(yōu)化>這是一本機(jī)器學(xué)習(xí)的小冊(cè)子, 短短300多頁(yè)道盡機(jī)器學(xué)習(xí)的方方面面. 圖文并茂, 生動(dòng)易懂, 沒有一坨坨公式的煩惱. 適合新手入門打基礎(chǔ), 也適合老手溫故而知新. 比起MLAPP/PRML等大部頭, 也許這本你更需要!具體內(nèi)容推薦閱讀:http://intelligent-optimization.org/LIONbook/
??? 《深度學(xué)習(xí)與統(tǒng)計(jì)學(xué)習(xí)理論》
介紹:作者是來(lái)自百度,不過他本人已經(jīng)在2014年4月份申請(qǐng)離職了。但是這篇文章很不錯(cuò)如果你不知道深度學(xué)習(xí)與支持向量機(jī)/統(tǒng)計(jì)學(xué)習(xí)理論有什么聯(lián)系?那么應(yīng)該立即看看這篇文章.
??? 《計(jì)算機(jī)科學(xué)中的數(shù)學(xué)》
介紹:這本書是由谷歌公司和MIT共同出品的計(jì)算機(jī)科學(xué)中的數(shù)學(xué):Mathematics for Computer Science,Eric Lehman et al 2013 。分為5大部分:1)證明,歸納。2)結(jié)構(gòu),數(shù)論,圖。3)計(jì)數(shù),求和,生成函數(shù)。4)概率,隨機(jī)行走。5)遞歸。等等
??? 《信息時(shí)代的計(jì)算機(jī)科學(xué)理論(Foundations of Data Science)》
介紹:信息時(shí)代的計(jì)算機(jī)科學(xué)理論,目前國(guó)內(nèi)有紙質(zhì)書購(gòu)買,iTunes購(gòu)買
??? 《Data Science with R》
介紹:這是一本由雪城大學(xué)新編的第二版《數(shù)據(jù)科學(xué)入門》教材:偏實(shí)用型,淺顯易懂,適合想學(xué)習(xí)R語(yǔ)言的同學(xué)選讀。
??? 《Twenty Questions for Donald Knuth》
介紹:這并不是一篇文檔或書籍。這是篇向圖靈獎(jiǎng)得主Donald Knuth提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20個(gè)問題,內(nèi)容包括TAOCP,P/NP問題,圖靈機(jī),邏輯,以及為什么大神不用電郵等等。
??? 《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》
介紹:不會(huì)統(tǒng)計(jì)怎么辦?不知道如何選擇合適的統(tǒng)計(jì)模型怎么辦?那這篇文章你的好好讀一讀了麻省理工Joshua B. Tenenbaum和劍橋Zoubin Ghahramani合作,寫了一篇關(guān)于automatic statistician的文章。可以自動(dòng)選擇回歸模型類別,還能自動(dòng)寫報(bào)告...
??? 《ICLR 2014論文集》
介紹:對(duì)深度學(xué)習(xí)和representation learning最新進(jìn)展有興趣的同學(xué)可以了解一下
??? 《Introduction to Information Retrieval》
介紹:這是一本信息檢索相關(guān)的書籍,是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的信息檢索教材之一。最近作者增加了該課程的幻燈片和作業(yè)。IR相關(guān)資源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html
??? 《Machine learning in 10 pictures》
介紹:Deniz Yuret用10張漂亮的圖來(lái)解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰
??? 《雅虎研究院的數(shù)據(jù)集匯總》
介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語(yǔ)言類數(shù)據(jù),圖與社交類數(shù)據(jù),評(píng)分與分類數(shù)據(jù),計(jì)算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競(jìng)賽數(shù)據(jù),以及系統(tǒng)類的數(shù)據(jù)。
??? 《An Introduction to Statistical Learning with Applications in R》
介紹:這是一本斯坦福統(tǒng)計(jì)學(xué)著名教授Trevor Hastie和Robert Tibshirani的新書,并且在2014年一月已經(jīng)開課:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
??? Best Machine Learning Resources for Getting Started
介紹:機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總是專為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。
??? My deep learning reading list
介紹:主要是順著Bengio的PAMI review的文章找出來(lái)的。包括幾本綜述文章,將近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。
??? Cross-Language Information Retrieval
介紹:這是一本書籍,主要介紹的是跨語(yǔ)言信息檢索方面的知識(shí)。理論很多
??? 探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探
介紹:本文共有三個(gè)系列,作者是來(lái)自IBM的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實(shí)現(xiàn)這些算法。探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類
??? 《Advice for students of machine learning》
介紹:康奈爾大學(xué)信息科學(xué)系助理教授David Mimno寫的《對(duì)機(jī)器學(xué)習(xí)初學(xué)者的一點(diǎn)建議》, 寫的挺實(shí)際,強(qiáng)調(diào)實(shí)踐與理論結(jié)合,最后還引用了馮 ? 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
??? 分布式并行處理的數(shù)據(jù)
介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。著重介紹了各種神級(jí)網(wǎng)絡(luò)算法的分布式實(shí)現(xiàn),做Distributed Deep Learning 的童鞋可以參考下
??? 《“機(jī)器學(xué)習(xí)”是什么?》
介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt是微軟研究院杰出科學(xué)家,17年來(lái)他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來(lái)機(jī)器學(xué)習(xí)變得炙手可熱,Platt和同事們遂決定開設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來(lái)看Platt的這篇博文
??? 《2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)ICML 2014 論文》
介紹:2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)(ICML)已經(jīng)于6月21-26日在國(guó)家會(huì)議中心隆重舉辦。本次大會(huì)由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這個(gè)有著30多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會(huì)首次來(lái)到中國(guó),已成功吸引海內(nèi)外1200多位學(xué)者的報(bào)名參與。干貨很多,值得深入學(xué)習(xí)下
??? 《Machine Learning for Industry: A Case Study》
介紹:這篇文章主要是以Learning to Rank為例說(shuō)明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet對(duì)NDCG之類不敏感,加入NDCG因素后變成了LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò)改為應(yīng)用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表論文為: From RankNet to LambdaRank to LambdaMART: An Overview 此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
 Some Notes on Applied Mathematics for Machine Learning
??? 100 Best GitHub: Deep Learning
介紹:100 Best GitHub: Deep Learning
??? 《UFLDL-斯坦福大學(xué)Andrew Ng教授“Deep Learning”教程》
介紹:本教程將闡述無(wú)監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點(diǎn)。通過學(xué)習(xí),你也將實(shí)現(xiàn)多個(gè)功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?#xff0c;并學(xué)習(xí)如何應(yīng)用/適應(yīng)這些想法到新問題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(shí)(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第II,III,IV章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在github上面已經(jīng)有python版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介紹:這份文檔來(lái)自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過有些地方會(huì)讓人眼前一亮,毛塞頓開。
??? Understanding Convolutions
介紹:這是一篇介紹圖像卷積運(yùn)算的文章,講的已經(jīng)算比較詳細(xì)的了
??? 《Machine Learning Summer School》
介紹:每天請(qǐng)一個(gè)大牛來(lái)講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計(jì)算以及人腦研究。https://www.youtube.com/user/smolix (需翻墻)
??? 《Awesome Machine Learning》
介紹:一個(gè)超級(jí)完整的機(jī)器學(xué)習(xí)開源庫(kù)總結(jié),如果你認(rèn)為這個(gè)碉堡了,那后面這個(gè)列表會(huì)更讓你驚訝:【Awesome Awesomeness】,國(guó)內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費(fèi)電子書
??? 斯坦福《自然語(yǔ)言處理》課程視頻
介紹:ACL候任主席、斯坦福大學(xué)計(jì)算機(jī)系Chris Manning教授的《自然語(yǔ)言處理》課程所有視頻已經(jīng)可以在斯坦福公開課網(wǎng)站上觀看了(如Chrome不行,可用IE觀看) 作業(yè)與測(cè)驗(yàn)也可以下載。
??? 《Deep Learning and Shallow Learning》
介紹:對(duì)比 Deep Learning 和 Shallow Learning 的好文,來(lái)著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。
??? 《Recommending music on Spotify with deep learning》
介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂推薦。
??? 《Neural Networks and Deep Learning》
介紹:神經(jīng)網(wǎng)絡(luò)的免費(fèi)在線書,已經(jīng)寫了三章了,還有對(duì)應(yīng)的開源代碼:https://github.com/mnielsen/neural-networks-and-deep-learning 愛好者的福音。
??? 《Java Machine Learning》
介紹:Java機(jī)器學(xué)習(xí)相關(guān)平臺(tái)和開源的機(jī)器學(xué)習(xí)庫(kù),按照大數(shù)據(jù)、NLP、計(jì)算機(jī)視覺和Deep Learning分類進(jìn)行了整理。看起來(lái)挺全的,Java愛好者值得收藏。
??? 《Machine Learning Theory: An Introductory Primer》
介紹:機(jī)器學(xué)習(xí)最基本的入門文章,適合零基礎(chǔ)者
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
介紹:機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來(lái)的。這里,我們從兩個(gè)方面來(lái)給大家介紹,第一個(gè)方面是學(xué)習(xí)的方式,第二個(gè)方面是算法的類似性。
??? 《機(jī)器學(xué)習(xí)經(jīng)典論文/survey合集》
介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒錯(cuò)。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。
??? 《機(jī)器學(xué)習(xí)視頻庫(kù)》
介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語(yǔ)底子。
??? 《機(jī)器學(xué)習(xí)經(jīng)典書籍》
介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書籍,可做為入門參考書單。
??? 《16 Free eBooks On Machine Learning》
介紹:16本機(jī)器學(xué)習(xí)的電子書,可以下載下來(lái)在pad,手機(jī)上面任意時(shí)刻去閱讀。不多我建議你看完一本再下載一本。
??? 《A Large set of Machine Learning Resources for Beginners to Mavens》
介紹:標(biāo)題很大,從新手到專家。不過看完上面所有資料。肯定是專家了
??? 《機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總》
介紹:入門的書真的很多,而且我已經(jīng)幫你找齊了。
??? 《Sibyl》
介紹:Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如 YouTube 的視頻推薦。
??? 《Deep Learning》
介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著
??? 《Neural Network & Text Mining》
介紹:關(guān)于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結(jié)
??? 《前景目標(biāo)檢測(cè)1(總結(jié))》
介紹:計(jì)算機(jī)視覺入門之前景目標(biāo)檢測(cè)1(總結(jié))
??? 《行人檢測(cè)》
介紹:計(jì)算機(jī)視覺入門之行人檢測(cè)
??? 《Deep Learning – important resources for learning and understanding》
介紹:Important resources for learning and understanding . Is awesome
??? 《Machine Learning Theory: An Introductory Primer》
介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門文章。值得一讀
??? 《Neural Networks and Deep Learning》
介紹:在線Neural Networks and Deep Learning電子書
??? 《Python 網(wǎng)頁(yè)爬蟲 & 文本處理 & 科學(xué)計(jì)算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》
介紹:python的17個(gè)關(guān)于機(jī)器學(xué)習(xí)的工具
??? 《神奇的伽瑪函數(shù)(上)》
介紹:下集在這里神奇的伽瑪函數(shù)(下)
??? 《分布式機(jī)器學(xué)習(xí)的故事》
介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在google任研究。這篇文章王益博士7年來(lái)從谷歌到騰訊對(duì)于分布機(jī)器學(xué)習(xí)的所見所聞。值得細(xì)讀
??? 《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》
介紹:把機(jī)器學(xué)習(xí)提升的級(jí)別分為0~4級(jí),每級(jí)需要學(xué)習(xí)的教材和掌握的知識(shí)。這樣,給機(jī)器學(xué)習(xí)者提供一個(gè)上進(jìn)的路線圖,以免走彎路。另外,整個(gè)網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。
??? 《Machine Learning Surveys》
介紹:機(jī)器學(xué)習(xí)各個(gè)方向綜述的網(wǎng)站
??? 《Deep Learning Reading list》
介紹:深度學(xué)習(xí)閱資源列表
??? 《Deep Learning: Methods and Applications》
介紹:這是一本來(lái)自微的研究員 li Peng和Dong Yu所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書
??? 《Machine Learning Summer School 2014》
介紹:2014年七月CMU舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束 有近50小時(shí)的視頻、十多個(gè)PDF版幻燈片,覆蓋 深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性 等熱點(diǎn)話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有CMU李沐 .(1080P高清喲)
??? 《Sibyl: 來(lái)自Google的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》
介紹:在今年的IEEE/IFIP可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國(guó)際會(huì)議上,Google軟件工程師Tushar Chandra做了一個(gè)關(guān)于Sibyl系統(tǒng)的主題演講。 Sibyl是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如YouTube的視頻推薦。詳情請(qǐng)閱讀google sibyl
??? 《Building a deeper understanding of images》
介紹:谷歌研究院的Christian Szegedy在谷歌研究院的博客上簡(jiǎn)要地介紹了他們今年參加ImageNet取得好成績(jī)的GoogLeNet系統(tǒng).是關(guān)于圖像處理的。
??? 《Bayesian network 與python概率編程實(shí)戰(zhàn)入門》
介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語(yǔ)言與貝葉斯方法實(shí)踐
??? 《AMA: Michael I Jordan》
介紹:網(wǎng)友問伯克利機(jī)器學(xué)習(xí)大牛、美國(guó)雙料院士Michael I. Jordan:"如果你有10億美金,你怎么花?Jordan: "我會(huì)用這10億美金建造一個(gè)NASA級(jí)別的自然語(yǔ)言處理研究項(xiàng)目。"
??? 《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理)》
介紹:常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理,此外作者還有一些其他的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘文章和深度學(xué)習(xí)文章,不僅是理論還有源碼。
??? 《文本與數(shù)據(jù)挖掘視頻匯總》
介紹:Videolectures上最受歡迎的25個(gè)文本與數(shù)據(jù)挖掘視頻匯總
??? 《怎么選擇深度學(xué)習(xí)的GPUs》
介紹:在Kaggle上經(jīng)常取得不錯(cuò)成績(jī)的Tim Dettmers介紹了他自己是怎么選擇深度學(xué)習(xí)的GPUs, 以及個(gè)人如何構(gòu)建深度學(xué)習(xí)的GPU集群: http://t.cn/RhpuD1G
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:深度模型》
介紹:對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan
??? 《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》
介紹:還有2,3部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html
??? 《Deep Learning 教程翻譯》
介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國(guó)內(nèi)的機(jī)器學(xué)習(xí)愛好者很熱心的把這個(gè)教程翻譯成了中文。如果你英語(yǔ)不好,可以看看這個(gè)
??? 《Deep Learning 101》
介紹:因?yàn)榻鼉赡陙?lái),深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實(shí)很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!
??? 《UFLDL Tutorial》
介紹:這是斯坦福大學(xué)做的一免費(fèi)課程(很勉強(qiáng)),這個(gè)可以給你在深度學(xué)習(xí)的路上給你一個(gè)學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實(shí)際環(huán)境中。中文版
??? 《Toronto Deep Learning Demos》
介紹:這是多倫多大學(xué)做的一個(gè)深度學(xué)習(xí)用來(lái)識(shí)別圖片標(biāo)簽/圖轉(zhuǎn)文字的demo。是一個(gè)實(shí)際應(yīng)用案例。有源碼
??? 《Deep learning from the bottom up》
介紹:機(jī)器學(xué)習(xí)模型,閱讀這個(gè)內(nèi)容需要有一定的基礎(chǔ)。
??? 《R工具包的分類匯總》
介紹: (CRAN Task Views, 34種常見任務(wù),每個(gè)任務(wù)又各自分類列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語(yǔ)言處理,時(shí)間序列分析,空間信息分析,多重變量分析,計(jì)量經(jīng)濟(jì)學(xué),心理統(tǒng)計(jì)學(xué),社會(huì)學(xué)統(tǒng)計(jì),化學(xué)計(jì)量學(xué),環(huán)境科學(xué),藥物代謝動(dòng)力學(xué) 等
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
介紹: 機(jī)器學(xué)習(xí)無(wú)疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.
??? 《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
介紹: 很多干貨,而且作者還總結(jié)了好幾個(gè)系列。另外還作者還了一個(gè)文章導(dǎo)航.非常的感謝作者總結(jié)。
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)
DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)
??? 《Tutorials Session A - Deep Learning for Computer Vision》
介紹:傳送理由:Rob Fergus的用深度學(xué)習(xí)做計(jì)算機(jī)是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載 他是紐約大學(xué)教授,目前也在Facebook工作,他2014年的8篇論文
??? 《FudanNLP》
介紹:FudanNLP,這是一個(gè)復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院開發(fā)的開源中文自然語(yǔ)言處理(NLP)工具包 Fudan NLP里包含中文分詞、關(guān)鍵詞抽取、命名實(shí)體識(shí)別、詞性標(biāo)注、時(shí)間詞抽取、語(yǔ)法分析等功能,對(duì)搜索引擎 文本分析等極為有價(jià)值。
??? 《Open Sourcing ml-ease》
介紹:LinkedIn 開源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點(diǎn)是 logistic regression 算法
??? 《機(jī)器學(xué)習(xí)周刊》
介紹:對(duì)于英語(yǔ)不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個(gè)大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國(guó)內(nèi)愛好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識(shí)別、人工智能、機(jī)器人等等。謝謝作者
??? 《線性代數(shù)》
介紹:《線性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實(shí)《線代》這門課講得淺顯易懂特別不容易,如果一上來(lái)就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個(gè)人推薦的最佳《線性代數(shù)》課程是麻省理工Gilbert Strang教授的課程。 課程主頁(yè)
??? 《Big-data》
介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲(chǔ)、機(jī)器學(xué)習(xí)等。很贊的資源匯總。
??? 《machine learning for smart dummies》
介紹:雅虎邀請(qǐng)了一名來(lái)自本古里安大學(xué)的訪問學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為7期,詳細(xì)講解了有關(guān)SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識(shí)。
??? 《Entanglement-Based Quantum Machine Learning》
介紹:應(yīng)對(duì)大數(shù)據(jù)時(shí)代,量子機(jī)器學(xué)習(xí)的第一個(gè)實(shí)驗(yàn) paper 下載
??? 《How a Math Genius Hacked OkCupid to Find True Love》
介紹:Wired雜志報(bào)道了UCLA數(shù)學(xué)博士Chris McKinlay (圖1)通過大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對(duì)算法找到真愛的故事,通過Python腳本控制著12個(gè)賬號(hào),下載了婚戀網(wǎng)站2萬(wàn)女用戶的600萬(wàn)問題答案,對(duì)他們進(jìn)行了統(tǒng)計(jì)抽樣及聚類分析(圖2,3),最后終于收獲了真愛。科技改變命運(yùn)!
??? 《Underactuated Robotics》
介紹:MIT的Underactuated Robotics于 2014年10月1日開課,該課屬于MIT研究生級(jí)別的課程,對(duì)機(jī)器人和非線性動(dòng)力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門課程!
??? 《mllib實(shí)踐經(jīng)驗(yàn)(1)》
介紹:mllib實(shí)踐經(jīng)驗(yàn)分享
??? 《Google Turns To Deep Learning Classification To Fight Web Spam》
介紹:Google用Deep Learning做的antispam(反垃圾郵件)
??? 《NLP常用信息資源》
介紹:NLP常用信息資源* 《NLP常用信息資源》
??? 《機(jī)器學(xué)習(xí)速查表》
介紹:機(jī)器學(xué)習(xí)速查表
??? 《Best Papers vs. Top Cited Papers in Computer Science》
介紹:從1996年開始在計(jì)算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文
??? 《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》
介紹:把今年的一個(gè)ACM Trans. on Graphics (TOG)論文中的代碼整理為一個(gè)開源的算法框架,共享出來(lái)了。歡迎大家使用。可以實(shí)時(shí)的采集3D數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會(huì)后續(xù)公開。
??? 《Hacker's guide to Neural Networks》
介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開源項(xiàng)目convnetjs作者karpathy告訴你,最佳技巧是,當(dāng)你開始寫代碼,一切將變得清晰。他剛發(fā)布了一本圖書,不斷在線更新
??? 《Building a Production Machine Learning Infrastructure》
介紹:前Google廣告系統(tǒng)工程師Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實(shí)話
??? 《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
介紹:使用Neo4j 做電影評(píng)論的情感分析。
??? 《DeepLearning.University – An Annotated Deep Learning Bibliography》
介紹:不僅是資料,而且還對(duì)有些資料做了注釋。
??? 《A primer on deeping learning》
介紹:深度學(xué)習(xí)入門的初級(jí)讀本
??? 《Machine learning is teaching us the secret to teaching 》
介紹:機(jī)器學(xué)習(xí)教會(huì)了我們什么?
??? 《scikit-learn:用于機(jī)器學(xué)習(xí)的Python模塊》
介紹:scikit-learn是在SciPy基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的Python模塊。
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:解析領(lǐng)域中各類模型》
介紹:喬丹教授(Michael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對(duì)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問的問題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類模型,喬丹教授對(duì)此一一做了解釋和展望。
??? 《A*搜索算法的可視化短教程》
介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點(diǎn)的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點(diǎn)到頂點(diǎn)n的實(shí)際代價(jià),h(n)是頂點(diǎn)n到目標(biāo)頂點(diǎn)的估算代價(jià)。合集
??? 《基于云的自然語(yǔ)言處理開源項(xiàng)目FudanNLP》
介紹:本項(xiàng)目利用了Microsoft Azure,可以在幾分種內(nèi)完成NLP on Azure Website的部署,立即開始對(duì)FNLP各種特性的試用,或者以REST API的形式調(diào)用FNLP的語(yǔ)言分析功能
??? 《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》
介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計(jì)算機(jī)軟件博士生導(dǎo)師。計(jì)算機(jī)科學(xué)研究所副所長(zhǎng).內(nèi)部課程
??? 《機(jī)器學(xué)習(xí)入門資源不完全匯總》》
介紹:好東西的干貨真的很多
??? 《收集從2014年開始深度學(xué)習(xí)文獻(xiàn)》
介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計(jì)算等,Amund Tveit等維護(hù)了一個(gè)DeepLearning.University小項(xiàng)目:收集從2014年開始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點(diǎn),github
??? 《EMNLP上兩篇關(guān)于股票趨勢(shì)的應(yīng)用論文 》
介紹:EMNLP上兩篇關(guān)于stock trend 用到了deep model組織特征; Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。
??? 《Bengio組(蒙特利爾大學(xué)LISA組)深度學(xué)習(xí)教程 》
介紹:作者是深度學(xué)習(xí)一線大牛Bengio組寫的教程,算法深入顯出,還有實(shí)現(xiàn)代碼,一步步展開。
??? 《學(xué)習(xí)算法的Neural Turing Machine 》
介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí)function,不過谷歌目前有開始學(xué)習(xí)算法的趨勢(shì)。谷歌另外的這篇學(xué)習(xí)Python程序的Learning to Execute也有相似之處
??? 《Learning to Rank for Information Retrieval and Natural Language Processing》
介紹:作者是華為技術(shù)有限公司,諾亞方舟實(shí)驗(yàn)室,首席科學(xué)家的李航博士寫的關(guān)于信息檢索與自然語(yǔ)言處理的文章
??? 《Rumor has it: Identifying Misinformation in Microblogs》
介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個(gè)。一個(gè)是識(shí)別垃圾與虛假信息的paper.還有一個(gè)是網(wǎng)絡(luò)輿情及其分析技術(shù)
??? 《R機(jī)器學(xué)習(xí)實(shí)踐》
介紹:該課程是網(wǎng)易公開課的收費(fèi)課程,不貴,超級(jí)便宜。主要適合于對(duì)利用R語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。
??? 《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化》
介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer實(shí)現(xiàn)基于Hadoop的擴(kuò)展,第三代如Spark和Storm實(shí)現(xiàn)了實(shí)時(shí)和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP
??? 《圖像處理,分析與機(jī)器視覺》
介紹:講計(jì)算機(jī)視覺的四部奇書(應(yīng)該叫經(jīng)典吧)之一,另外三本是Hartley的《多圖幾何》、Gonzalez的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》
??? 《LinkedIn最新的推薦系統(tǒng)文章Browsemaps》
介紹:里面基本沒涉及到具體算法,但作者介紹了CF在LinkedIn的很多應(yīng)用,以及他們?cè)谧鐾扑]過程中獲得的一些經(jīng)驗(yàn)。最后一條經(jīng)驗(yàn)是應(yīng)該監(jiān)控log數(shù)據(jù)的質(zhì)量,因?yàn)橥扑]的質(zhì)量很依賴數(shù)據(jù)的質(zhì)量!
??? 《初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料》
介紹:初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料
??? 《樹莓派的人臉識(shí)別教程》
介紹:用樹莓派和相機(jī)模塊進(jìn)行人臉識(shí)別
??? 《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng) 》
介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng)
??? 《經(jīng)典論文Leo Breiman:Statistical Modeling: The Two Cultures 》
介紹:Francis Bach合作的有關(guān)稀疏建模的新綜述(書):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理論,以及在圖像和視覺上的應(yīng)用,而且第一部分關(guān)于Why does the l1-norm induce sparsity的解釋也很不錯(cuò)。
??? 《Reproducing Kernel Hilbert Space》
介紹:RKHS是機(jī)器學(xué)習(xí)中重要的概念,其在large margin分類器上的應(yīng)用也是廣為熟知的。如果沒有較好的數(shù)學(xué)基礎(chǔ),直接理解RKHS可能會(huì)不易。本文從基本運(yùn)算空間講到Banach和Hilbert空間,深入淺出,一共才12頁(yè)。
??? 《Hacker's guide to Neural Networks》
介紹:許多同學(xué)對(duì)于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動(dòng)起手來(lái)卻不知道如何下手寫代碼。斯坦福深度學(xué)習(xí)博士Andrej Karpathy寫了一篇實(shí)戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用Javascript寫神經(jīng)網(wǎng)絡(luò)和SVM.
??? 《【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總》
介紹:【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總
??? 《機(jī)器學(xué)習(xí)算法之旅》
介紹:本文會(huì)過一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。
??? 《Reproducible Research in Computational Science》
介紹:這個(gè)里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號(hào)處理、計(jì)算機(jī)視覺、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文。科研寫論文的好資源
??? 《NYU 2014年的深度學(xué)習(xí)課程資料》
介紹:NYU 2014年的深度學(xué)習(xí)課程資料,有視頻
??? 《計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總》
介紹:計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總
??? 《Machine Learning Open Source Software》
介紹:機(jī)器學(xué)習(xí)開源軟件
??? 《LIBSVM》
介紹:A Library for Support Vector Machines
??? 《Support Vector Machines》
介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一
??? 《100 Best GitHub: Deep Learning》
介紹:github上面100個(gè)非常棒的項(xiàng)目
??? 《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉(cāng)庫(kù)》
介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著306個(gè)數(shù)據(jù)集。查詢數(shù)據(jù)集
??? 《Andrej Karpathy個(gè)人主頁(yè)》
介紹:Andrej Karpathy 是斯坦福大學(xué)Li Fei-Fei的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語(yǔ)義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個(gè)都很扎實(shí),在每一個(gè)問題上都做到了state-of-art.
??? 《Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示》
介紹:Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示,論文在這里
??? 《CIKM數(shù)據(jù)挖掘競(jìng)賽奪冠算法-陳運(yùn)文》
介紹:CIKM Cup(或者稱為CIKM Competition)是ACM CIKM舉辦的國(guó)際數(shù)據(jù)挖掘競(jìng)賽的名稱。
??? 《Geoffrey E. Hinton》
介紹:杰弗里·埃弗里斯特·辛頓 FRS是一位英國(guó)出生的計(jì)算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對(duì)比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動(dòng)者.
??? 《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》
介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在CIKM2014 上關(guān)于《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》教學(xué)講座的幻燈片
??? 《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價(jià)格預(yù)測(cè)》
介紹: 本文基于<支持向量機(jī)的高頻限價(jià)訂單的動(dòng)態(tài)建模>采用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價(jià)格運(yùn)動(dòng)預(yù)測(cè)模型。(股票有風(fēng)險(xiǎn),投資謹(jǐn)慎)GitHub源代碼托管地址.
??? 《關(guān)于機(jī)器學(xué)習(xí)的若干理論問題》
介紹:徐宗本 院士將于熱愛機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個(gè)理論性問題,并給出一些有意義的結(jié)論。最后通過一些實(shí)例來(lái)說(shuō)明這些理論問題的物理意義和實(shí)際應(yīng)用價(jià)值。
??? 《深度學(xué)習(xí)在自然語(yǔ)言處理的應(yīng)用》
介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書,主要是介紹應(yīng)用層的東西
??? 《Undergraduate machine learning at UBC》
介紹:機(jī)器學(xué)習(xí)課程
??? 《人臉識(shí)別必讀的N篇文章》
介紹:人臉識(shí)別必讀文章推薦
??? 《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》
介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)
??? 《人臉識(shí)別必讀的N篇文章》
介紹:人臉識(shí)別必讀文章推薦
??? 《第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT》
介紹:第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT
??? 《統(tǒng)計(jì)機(jī)器學(xué)習(xí)》
介紹:統(tǒng)計(jì)學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計(jì)模型并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析的一門科學(xué),統(tǒng)計(jì)學(xué)習(xí)也成為統(tǒng)計(jì)機(jī)器學(xué)習(xí)。課程來(lái)自上海交通大學(xué)
??? 《機(jī)器學(xué)習(xí)導(dǎo)論》
介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對(duì)計(jì)算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗(yàn)來(lái)解決給定的問題.
??? 《CIKM 2014主題報(bào)告的幻燈片》
介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報(bào)告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報(bào)告的幻燈片
??? 《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項(xiàng)目》
介紹:部分中文列表
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--基于SMO的SVM分類器》
介紹:此外作者還有一篇元算法、AdaBoost python實(shí)現(xiàn)文章
??? 《Numerical Optimization: Understanding L-BFGS》
介紹:加州伯克利大學(xué)博士Aria Haghighi寫了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到BFGS以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。
??? 《簡(jiǎn)明深度學(xué)習(xí)方法概述(一)》
介紹:還有續(xù)集簡(jiǎn)明深度學(xué)習(xí)方法概述(二)
??? 《R language for programmers》
介紹:R語(yǔ)言程序員私人定制版
??? 《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
介紹:谷歌地圖解密
??? 《空間數(shù)據(jù)挖掘常用方法》
介紹:空間數(shù)據(jù)挖掘常用方法
??? 《Use Google's Word2Vec for movie reviews》
介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在實(shí)際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過gensim不要忘升級(jí)
??? 《PyNLPIR》
介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語(yǔ)分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字符和偏旁,中文標(biāo)點(diǎn),拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
??? 《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
介紹:這文章說(shuō)把最近模型識(shí)別上的突破應(yīng)用到圍棋軟件上,打16萬(wàn)張職業(yè)棋譜訓(xùn)練模型識(shí)別功能。想法不錯(cuò)。訓(xùn)練后目前能做到不用計(jì)算,只看棋盤就給出下一步,大約10級(jí)棋力。但這篇文章太過樂觀,說(shuō)什么人類的最后一塊堡壘馬上就要跨掉了。話說(shuō)得太早。不過,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬(wàn)精油墨綠
??? 《NIPS審稿實(shí)驗(yàn)》
介紹:UT Austin教授Eric Price關(guān)于今年NIPS審稿實(shí)驗(yàn)的詳細(xì)分析,他表示,根據(jù)這次實(shí)驗(yàn)的結(jié)果,如果今年NIPS重新審稿的話,會(huì)有一半的論文被拒。
??? 《2014年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》
介紹:KDNuggets分別總結(jié)了2014年14個(gè)閱讀最多以及分享最多的文章。我們從中可以看到多個(gè)主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和Python以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語(yǔ)言
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--線性回歸(Linear Regression)算法》
介紹:Python實(shí)現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看
??? 《2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF》
介紹:2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF下載
??? 《使用RNN和Paragraph Vector做情感分析》
介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不錯(cuò),[項(xiàng)目代碼](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。這意味著Paragraph Vector終于揭開面紗了嘛。
??? 《NLPIR/ICTCLAS2015分詞系統(tǒng)大會(huì)上的技術(shù)演講 》
介紹:NLPIR/ICTCLAS2015分詞系統(tǒng)發(fā)布與用戶交流大會(huì)上的演講,請(qǐng)更多朋友檢閱新版分詞吧。 我們實(shí)驗(yàn)室同學(xué)的演講包括:孫夢(mèng)姝-基于評(píng)論觀點(diǎn)挖掘的商品搜索技術(shù)研究 李然-主題模型
??? 《Machine Learning is Fun!》
介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
??? 《CNN的反向求導(dǎo)及練習(xí)》
介紹:介紹CNN參數(shù)在使用bp算法時(shí)該怎么訓(xùn)練,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個(gè)資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺,數(shù)學(xué)等
??? 《正則表達(dá)式優(yōu)化成Trie樹 》
介紹:如果要在一篇文章中匹配十萬(wàn)個(gè)關(guān)鍵詞怎么辦?Aho-Corasick 算法利用添加了返回邊的Trie樹,能夠在線性時(shí)間內(nèi)完成匹配。 但如果匹配十萬(wàn)個(gè)正則表達(dá)式呢 ? 這時(shí)候可以用到把多個(gè)正則優(yōu)化成Trie樹的方法,如日本人寫的 Regexp::Trie
??? 《Deep learning Reading List》
介紹:深度學(xué)習(xí)閱讀清單
??? 《Caffe》
介紹:Caffe是一個(gè)開源的深度學(xué)習(xí)框架,作者目前在google工作,作者主頁(yè)Yangqing Jia (賈揚(yáng)清)
??? 《GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn) 》
介紹:2014 ImageNet冠軍GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn)模型,GoogleNet論文.
??? 《LambdaNet,Haskell實(shí)現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫(kù) 》
介紹:LambdaNetLambdaNet是由Haskell實(shí)現(xiàn)的一個(gè)開源的人工神經(jīng)網(wǎng)絡(luò)庫(kù),它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫(kù)還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來(lái)操作現(xiàn)實(shí)世界數(shù)據(jù)。
??? 《百度余凱&張潼機(jī)器學(xué)習(xí)視頻》
介紹:如果你從事互聯(lián)網(wǎng)搜索,在線廣告,用戶行為分析,圖像識(shí)別,自然語(yǔ)言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測(cè),那么這門核心課程你必須深入了解。
??? 《楊強(qiáng)在TEDxNanjing談智能的起源》
介紹:"人工智能研究分許多流派。其中之一以IBM為代表,認(rèn)為只要有高性能計(jì)算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智能來(lái)自動(dòng)物本能;還有個(gè)很強(qiáng)的流派認(rèn)為只要找來(lái)專家,把他們的思維用邏輯一條條寫下,放到計(jì)算機(jī)里就行……" 楊強(qiáng)在TEDxNanjing談智能的起源
??? 《深度RNN/LSTM用于結(jié)構(gòu)化學(xué)習(xí) 0)序列標(biāo)注Connectionist Temporal ClassificationICML06》
介紹:1)機(jī)器翻譯Sequence to Sequence NIPS14 2)成分句法GRAMMAR AS FOREIGN LANGUAGE
??? 《Deep Learning實(shí)戰(zhàn)之word2vec》
介紹:網(wǎng)易有道的三位工程師寫的word2vec的解析文檔,從基本的詞向量/統(tǒng)計(jì)語(yǔ)言模型->NNLM->Log-Linear/Log-Bilinear->層次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各種tricks,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于word2vec資料的大合集,對(duì)word2vec感興趣的朋友可以看看
??? 《Machine learning open source software》
介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語(yǔ)言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
??? 《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》
介紹:作者是計(jì)算機(jī)研二(寫文章的時(shí)候,現(xiàn)在是2015年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語(yǔ)言處理.這是一點(diǎn)他的經(jīng)驗(yàn)之談.對(duì)于入門的朋友或許會(huì)有幫助
??? 《A Tour of Machine Learning Algorithms》
介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章,非常好
??? 《2014年的《機(jī)器學(xué)習(xí)日?qǐng)?bào)》大合集》
介紹:機(jī)器學(xué)習(xí)日?qǐng)?bào)里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來(lái)自機(jī)器學(xué)習(xí)日?qǐng)?bào).
??? 《 Image classification with deep learning常用模型》
介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章
??? 《自動(dòng)語(yǔ)音識(shí)別:深度學(xué)習(xí)方法》
介紹:作者與Bengio的兄弟Samy 09年合編《自動(dòng)語(yǔ)音識(shí)別:核方法》 3)李開復(fù)1989年《自動(dòng)語(yǔ)音識(shí)別》專著,其博導(dǎo)、94年圖靈獎(jiǎng)得主Raj Reddy作序
??? 《NLP中的中文分詞技術(shù)》
介紹: 作者是360電商技術(shù)組成員,這是一篇NLP在中文分詞中的應(yīng)用
??? 《Using convolutional neural nets to detect facial keypoints tutorial》
介紹: 使用deep learning的人臉關(guān)鍵點(diǎn)檢測(cè),此外還有一篇AWS部署教程
??? 《書籍推薦:Advanced Structured Prediction》
介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG ,匯集了結(jié)構(gòu)化預(yù)測(cè)領(lǐng)域諸多牛文,涉及CV、NLP等領(lǐng)域,值得一讀。網(wǎng)上公開的幾章草稿:一,二,三,四,五
??? 《An Introduction to Matrix Concentration Inequalities》
介紹: Tropp把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語(yǔ)言寫的矩陣概率不等式用初等的方法寫出來(lái),是非常好的手冊(cè),領(lǐng)域內(nèi)的paper各種證明都在用里面的結(jié)果。雖說(shuō)是初等的,但還是非常的難
??? 《The free big data sources you should know》
介紹: 不容錯(cuò)過的免費(fèi)大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽說(shuō),內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧,具體包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等
??? 《A Brief Overview of Deep Learning》
介紹: 谷歌科學(xué)家、Hinton親傳弟子Ilya Sutskever的深度學(xué)習(xí)綜述及實(shí)際建議
??? 《A Deep Dive into Recurrent Neural Nets》
介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了RNN的概念、原理、訓(xùn)練及優(yōu)化等各個(gè)方面內(nèi)容,強(qiáng)烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦
??? 《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
介紹:里面融合了很多的資源,例如競(jìng)賽,在線課程,demo,數(shù)據(jù)整合等。有分類
??? 《Statistical foundations of machine learning》
介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計(jì)基礎(chǔ)》在線版,該手冊(cè)希望在理論與實(shí)踐之間找到平衡點(diǎn),各主要內(nèi)容都伴有實(shí)際例子及數(shù)據(jù),書中的例子程序都是用R語(yǔ)言編寫的。
??? 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介紹:IVAN VASILEV寫的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀
??? 《Research priorities for robust and beneficial artificial intelligence》
介紹:魯棒及有益的人工智能優(yōu)先研究計(jì)劃:一封公開信,目前已經(jīng)有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人簽署The Future of Life Institute (FLI).這封信的背景是最近霍金和Elon Musk提醒人們注意AI的潛在威脅。公開信的內(nèi)容是AI科學(xué)家們站在造福社會(huì)的角度,展望人工智能的未來(lái)發(fā)展方向,提出開發(fā)AI系統(tǒng)的Verification,Validity, Security, Control四點(diǎn)要求,以及需要注意的社會(huì)問題。畢竟當(dāng)前AI在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實(shí)還有一部美劇《疑犯追蹤》,介紹了AI的演進(jìn)從一開始的自我學(xué)習(xí),過濾,圖像識(shí)別,語(yǔ)音識(shí)別等判斷危險(xiǎn),到第四季的時(shí)候出現(xiàn)了機(jī)器通過學(xué)習(xí)成長(zhǎng)之后想控制世界的狀態(tài)。說(shuō)到這里推薦收看。
??? 《metacademy》
介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識(shí)結(jié)構(gòu),路線圖,用時(shí)長(zhǎng)短等。號(hào)稱是”機(jī)器學(xué)習(xí)“搜索引擎
??? 《FAIR open sources deep-learning modules for Torch》
介紹:Facebook人工智能研究院(FAIR)開源了一系列軟件庫(kù),以幫助開發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開放的軟件庫(kù)在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
??? 《淺析人臉檢測(cè)之Haar分類器方法》
介紹:本文雖然是寫于2012年,但是這篇文章完全是作者的經(jīng)驗(yàn)之作。
??? 《如何成為一位數(shù)據(jù)科學(xué)家》
介紹:本文是對(duì)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》作者Peter Harrington做的一個(gè)訪談。包含了書中部分的疑問解答和一點(diǎn)個(gè)人學(xué)習(xí)建議
??? 《Deep learning from the bottom up》
介紹:非常好的深度學(xué)習(xí)概述,對(duì)幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論
??? 《Hands-On Data Science with R Text Mining》
介紹:主要是講述了利用R語(yǔ)言進(jìn)行數(shù)據(jù)挖掘
??? 《Understanding Convolutions》
介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒
??? 《Introduction to Deep Learning Algorithms》
介紹:Deep Learning算法介紹,里面介紹了06年3篇讓deep learning崛起的論文
??? 《Learning Deep Architectures for AI》
介紹:一本學(xué)習(xí)人工智能的書籍,作者是Yoshua Bengio,相關(guān)國(guó)內(nèi)報(bào)道
??? 《Geoffrey E. Hinton個(gè)人主頁(yè)》
介紹:Geoffrey Hinton是Deep Learning的大牛,他的主頁(yè)放了一些介紹性文章和課件值得學(xué)習(xí)
??? 《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
介紹:概率論:數(shù)理邏輯書籍
??? 《H2O》
介紹:一個(gè)用來(lái)快速的統(tǒng)計(jì),機(jī)器學(xué)習(xí)并且對(duì)于數(shù)據(jù)量大的數(shù)學(xué)庫(kù)
??? 《ICLR 2015會(huì)議的arXiv稿件合集》
介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動(dòng)向。
??? 《Introduction to Information Retrieval》
介紹:此書在信息檢索領(lǐng)域家喻戶曉, 除提供該書的免費(fèi)電子版外,還提供一個(gè)IR資源列表 ,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實(shí)現(xiàn)等方面相關(guān)的圖書、研究中心、相關(guān)課程、子領(lǐng)域、會(huì)議、期刊等等,堪稱全集,值得收藏
??? 《Information Geometry and its Applications to Machine Learning》
介紹:信息幾何學(xué)及其在機(jī)器學(xué)習(xí)中的應(yīng)用
??? 《Legal Analytics – Introduction to the Course》
介紹:課程《法律分析》介紹幻燈片。用機(jī)器學(xué)習(xí)解決法律相關(guān)分析和預(yù)測(cè)問題,相關(guān)的法律應(yīng)用包括預(yù)測(cè)編碼、早期案例評(píng)估、案件整體情況的預(yù)測(cè),定價(jià)和工作人員預(yù)測(cè),司法行為預(yù)測(cè)等。法律領(lǐng)域大家可能都比較陌生,不妨了解下。
??? 《文本上的算法》
介紹: 文中提到了最優(yōu),模型,最大熵等等理論,此外還有應(yīng)用篇。推薦系統(tǒng)可以說(shuō)是一本不錯(cuò)的閱讀稿,關(guān)于模型還推薦一篇Generative Model 與 Discriminative Model
??? 《NeuralTalk》
介紹: NeuralTalk is a Python+numpy project for learning Multimodal Recurrent Neural Networks that describe images with sentences.NeuralTalk是一個(gè)Python的從圖像生成自然語(yǔ)言描述的工具。它實(shí)現(xiàn)了Google (Vinyals等,卷積神經(jīng)網(wǎng)絡(luò)CNN + 長(zhǎng)短期記憶LSTM) 和斯坦福 (Karpathy and Fei-Fei, CNN + 遞歸神經(jīng)網(wǎng)絡(luò)RNN)的算法。NeuralTalk自帶了一個(gè)訓(xùn)練好的動(dòng)物模型,你可以拿獅子大象的照片來(lái)試試看
??? 《Deep Learning on Hadoop 2.0》
介紹:本文主要介紹了在Hadoop2.0上使用深度學(xué)習(xí),文章來(lái)自paypal
??? 《Practical recommendations for gradient-based training of deep architectures》
介紹:用基于梯度下降的方法訓(xùn)練深度框架的實(shí)踐推薦指導(dǎo),作者是Yoshua Bengio .感謝@xuewei4d 推薦
??? 《Machine Learning With Statistical And Causal Methods》
介紹: 用統(tǒng)計(jì)和因果方法做機(jī)器學(xué)習(xí)(視頻報(bào)告)
??? 《Machine Learning Course 180’》
介紹: 一個(gè)講機(jī)器學(xué)習(xí)的Youtube視頻教程。160集。系統(tǒng)程度跟書可比擬。
??? 《回歸(regression)、梯度下降(gradient descent)》
介紹: 機(jī)器學(xué)習(xí)中的數(shù)學(xué),作者的研究方向是機(jī)器學(xué)習(xí),并行計(jì)算如果你還想了解一點(diǎn)其他的可以看看他博客的其他文章
??? 《美團(tuán)推薦算法實(shí)踐》
介紹: 美團(tuán)推薦算法實(shí)踐,從框架,應(yīng)用,策略,查詢等分析
??? 《Deep Learning for Answer Sentence Selection》
介紹: 深度學(xué)習(xí)用于問答系統(tǒng)答案句的選取
??? 《Learning Semantic Representations Using Convolutional Neural Networks for Web Search 》
介紹: CNN用于WEB搜索,深度學(xué)習(xí)在文本計(jì)算中的應(yīng)用
??? 《Awesome Public Datasets》
介紹: Awesome系列中的公開數(shù)據(jù)集
??? 《Search Engine & Community》
介紹: 一個(gè)學(xué)術(shù)搜索引擎
??? 《spaCy》
介紹: 用Python和Cython寫的工業(yè)級(jí)自然語(yǔ)言處理庫(kù),號(hào)稱是速度最快的NLP庫(kù),快的原因一是用Cython寫的,二是用了個(gè)很巧妙的hash技術(shù),加速系統(tǒng)的瓶頸,NLP中稀松特征的存取
??? 《Collaborative Filtering with Spark》
介紹: Fields是個(gè)數(shù)學(xué)研究中心,上面的這份ppt是來(lái)自Fields舉辦的活動(dòng)中Russ Salakhutdinov帶來(lái)的《大規(guī)模機(jī)器學(xué)習(xí)》分享
??? 《Topic modeling 的經(jīng)典論文》
介紹: Topic modeling 的經(jīng)典論文,標(biāo)注了關(guān)鍵點(diǎn)
??? 《Move Evaluation in Go Using Deep Convolutional Neural Networks》
介紹: 多倫多大學(xué)與Google合作的新論文,深度學(xué)習(xí)也可以用來(lái)下圍棋,據(jù)說(shuō)能達(dá)到六段水平
??? 《機(jī)器學(xué)習(xí)周刊第二期》
介紹: 新聞,paper,課程,book,system,CES,Roboot,此外還推薦一個(gè)深度學(xué)習(xí)入門與綜述資料
??? 《Learning more like a human: 18 free eBooks on Machine Learning》
介紹: 18 free eBooks on Machine Learning
??? 《Recommend :Hang Li Home》
介紹:Chief scientist of Noah's Ark Lab of Huawei Technologies.He worked at the Research Laboratories of NEC Corporation during 1990 and 2001 and Microsoft Research Asia during 2001 and 2012.Paper
??? 《DEEPLEARNING.UNIVERSITY – AN ANNOTATED DEEP LEARNING BIBLIOGRAPHY》
介紹: DEEPLEARNING.UNIVERSITY的論文庫(kù)已經(jīng)收錄了963篇經(jīng)過分類的深度學(xué)習(xí)論文了,很多經(jīng)典論文都已經(jīng)收錄
??? 《MLMU.cz - Radim ?eh??ek - Word2vec & friends (7.1.2015)》
介紹: Radim ?eh??ek(Gensim開發(fā)者)在一次機(jī)器學(xué)習(xí)聚會(huì)上的報(bào)告,關(guān)于word2vec及其優(yōu)化、應(yīng)用和擴(kuò)展,很實(shí)用.國(guó)內(nèi)網(wǎng)盤
??? 《Introducing streaming k-means in Spark 1.2》
介紹:很多公司都用機(jī)器學(xué)習(xí)來(lái)解決問題,提高用戶體驗(yàn)。那么怎么可以讓機(jī)器學(xué)習(xí)更實(shí)時(shí)和有效呢?Spark MLlib 1.2里面的Streaming K-means,由斑馬魚腦神經(jīng)研究的Jeremy Freeman腦神經(jīng)科學(xué)家編寫,最初是為了實(shí)時(shí)處理他們每半小時(shí)1TB的研究數(shù)據(jù),現(xiàn)在發(fā)布給大家用了。
??? 《LDA入門與Java實(shí)現(xiàn)》
介紹: 這是一篇面向工程師的LDA入門筆記,并且提供一份開箱即用Java實(shí)現(xiàn)。本文只記錄基本概念與原理,并不涉及公式推導(dǎo)。文中的LDA實(shí)現(xiàn)核心部分采用了arbylon的LdaGibbsSampler并力所能及地注解了,在搜狗分類語(yǔ)料庫(kù)上測(cè)試良好,開源在GitHub上。
??? 《AMiner - Open Science Platform》
介紹: AMiner是一個(gè)學(xué)術(shù)搜索引擎,從學(xué)術(shù)網(wǎng)絡(luò)中挖掘深度知識(shí)、面向科技大數(shù)據(jù)的挖掘。收集近4000萬(wàn)作者信息、8000萬(wàn)論文信息、1億多引用關(guān)系、鏈接近8百萬(wàn)知識(shí)點(diǎn);支持專家搜索、機(jī)構(gòu)排名、科研成果評(píng)價(jià)、會(huì)議排名。
??? 《What are some interesting Word2Vec results?》
介紹: Quora上的主題,討論Word2Vec的有趣應(yīng)用,Omer Levy提到了他在CoNLL2014最佳論文里的分析結(jié)果和新方法,Daniel Hammack給出了找特異詞的小應(yīng)用并提供了(Python)代碼
??? 《機(jī)器學(xué)習(xí)公開課匯總》
介紹: 機(jī)器學(xué)習(xí)公開課匯總,雖然里面的有些課程已經(jīng)歸檔過了,但是還有個(gè)別的信息沒有。感謝課程圖譜的小編
??? 《A First Course in Linear Algebra》
介紹: 【A First Course in Linear Algebra】Robert Beezer 有答案 有移動(dòng)版、打印版 使用GNU自由文檔協(xié)議 引用了杰弗遜1813年的信
??? 《libfacedetection》
介紹:libfacedetection是深圳大學(xué)開源的一個(gè)人臉圖像識(shí)別庫(kù)。包含正面和多視角人臉檢測(cè)兩個(gè)算法.優(yōu)點(diǎn):速度快(OpenCV haar+adaboost的2-3倍), 準(zhǔn)確度高 (FDDB非公開類評(píng)測(cè)排名第二),能估計(jì)人臉角度。
??? 《Inverting a Steady-State》
介紹:WSDM2015最佳論文 把馬爾可夫鏈理論用在了圖分析上面,比一般的propagation model更加深刻一些。通過全局的平穩(wěn)分布去求解每個(gè)節(jié)點(diǎn)影響系數(shù)模型。假設(shè)合理(轉(zhuǎn)移受到相鄰的影響系數(shù)影響)。可以用來(lái)反求每個(gè)節(jié)點(diǎn)的影響系數(shù)
??? 《機(jī)器學(xué)習(xí)入門書單》
介紹:機(jī)器學(xué)習(xí)入門書籍,具體介紹
??? 《The Trouble with SVMs》
介紹: 非常棒的強(qiáng)調(diào)特征選擇對(duì)分類器重要性的文章。情感分類中,根據(jù)互信息對(duì)復(fù)雜高維特征降維再使用樸素貝葉斯分類器,取得了比SVM更理想的效果,訓(xùn)練和分類時(shí)間也大大降低——更重要的是,不必花大量時(shí)間在學(xué)習(xí)和優(yōu)化SVM上——特征也一樣no free lunch
??? 《Rise of the Machines》
介紹:CMU的統(tǒng)計(jì)系和計(jì)算機(jī)系知名教授Larry Wasserman 在《機(jī)器崛起》,對(duì)比了統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的差異
??? 《實(shí)例詳解機(jī)器學(xué)習(xí)如何解決問題》
介紹:隨著大數(shù)據(jù)時(shí)代的到來(lái),機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界,機(jī)器學(xué)習(xí)都是一個(gè)炙手可熱的方向,但是學(xué)術(shù)界和工業(yè)界對(duì)機(jī)器學(xué)習(xí)的研究各有側(cè)重,學(xué)術(shù)界側(cè)重于對(duì)機(jī)器學(xué)習(xí)理論的研究,工業(yè)界側(cè)重于如何用機(jī)器學(xué)習(xí)來(lái)解決實(shí)際問題。這篇文章是美團(tuán)的實(shí)際環(huán)境中的實(shí)戰(zhàn)篇
??? 《Gaussian Processes for Machine Learning》
介紹:面向機(jī)器學(xué)習(xí)的高斯過程,章節(jié)概要:回歸、分類、協(xié)方差函數(shù)、模型選擇與超參優(yōu)化、高斯模型與其他模型關(guān)系、大數(shù)據(jù)集的逼近方法等,微盤下載
??? 《FuzzyWuzzy: Fuzzy String Matching in Python》
介紹:Python下的文本模糊匹配庫(kù),老庫(kù)新推,可計(jì)算串間ratio(簡(jiǎn)單相似系數(shù))、partial_ratio(局部相似系數(shù))、token_sort_ratio(詞排序相似系數(shù))、token_set_ratio(詞集合相似系數(shù))等 github
??? 《Blocks》
介紹:Blocks是基于Theano的神經(jīng)網(wǎng)絡(luò)搭建框架,集成相關(guān)函數(shù)、管道和算法,幫你更快地創(chuàng)建和管理NN模塊.
??? 《Introduction to Machine Learning》
介紹:機(jī)器學(xué)習(xí)大神Alex Smola在CMU新一期的機(jī)器學(xué)習(xí)入門課程”Introduction to Machine Learning“近期剛剛開課,課程4K高清視頻同步到Y(jié)outube上,目前剛剛更新到 2.4 Exponential Families,課程視頻playlist, 感興趣的同學(xué)可以關(guān)注,非常適合入門.
??? 《Collaborative Feature Learning from Social Media》
介紹:用社交用戶行為學(xué)習(xí)圖片的協(xié)同特征,可更好地表達(dá)圖片內(nèi)容相似性。由于不依賴于人工標(biāo)簽(標(biāo)注),可用于大規(guī)模圖片處理,難在用戶行為數(shù)據(jù)的獲取和清洗;利用社會(huì)化特征的思路值得借鑒.
??? 《Introducing practical and robust anomaly detection in a time series》
介紹:Twitter技術(shù)團(tuán)隊(duì)對(duì)前段時(shí)間開源的時(shí)間序列異常檢測(cè)算法(S-H-ESD)R包的介紹,其中對(duì)異常的定義和分析很值得參考,文中也提到——異常是強(qiáng)針對(duì)性的,某個(gè)領(lǐng)域開發(fā)的異常檢測(cè)在其他領(lǐng)域直接用可不行.
??? 《Empower Your Team to Deal with Data-Quality Issues》
介紹:聚焦數(shù)據(jù)質(zhì)量問題的應(yīng)對(duì),數(shù)據(jù)質(zhì)量對(duì)各種規(guī)模企業(yè)的性能和效率都至關(guān)重要,文中總結(jié)出(不限于)22種典型數(shù)據(jù)質(zhì)量問題顯現(xiàn)的信號(hào),以及典型的數(shù)據(jù)質(zhì)量解決方案(清洗、去重、統(tǒng)一、匹配、權(quán)限清理等)
??? 《中文分詞入門之資源》
介紹:中文分詞入門之資源.
??? 《Deep Learning Summit, San Francisco, 2015》
介紹:15年舊金山深度學(xué)習(xí)峰會(huì)視頻集萃,國(guó)內(nèi)云盤
??? 《Introduction to Conditional Random Fields》
介紹:很好的條件隨機(jī)場(chǎng)(CRF)介紹文章,作者的學(xué)習(xí)筆記
??? 《A Fast and Accurate Dependency Parser using Neural Networks》
介紹: 來(lái)自Stanford,用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)快速準(zhǔn)確的依存關(guān)系解析器
??? 《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》
介紹:做深度學(xué)習(xí)如何選擇GPU的建議
??? 《Sparse Linear Models》
介紹: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的報(bào)告,講稀疏線性模型——面向“寬數(shù)據(jù)”(特征維數(shù)超過樣本數(shù))的線性模型,13年同主題報(bào)告 、講義.
??? 《Awesome Computer Vision》
介紹: 分類整理的機(jī)器視覺相關(guān)資源列表,秉承Awesome系列風(fēng)格,有質(zhì)有量!作者的更新頻率也很頻繁
??? 《Adam Szeidl》
介紹: social networks course
??? 《Building and deploying large-scale machine learning pipelines》
介紹: 大規(guī)模機(jī)器學(xué)習(xí)流程的構(gòu)建與部署.
??? 《人臉識(shí)別開發(fā)包》
介紹: 人臉識(shí)別二次開發(fā)包,免費(fèi),可商用,有演示、范例、說(shuō)明書.
??? 《Understanding Natural Language with Deep Neural Networks Using Torch》
介紹: 采用Torch用深度學(xué)習(xí)網(wǎng)絡(luò)理解NLP,來(lái)自Facebook 人工智能的文章.
??? 《The NLP Engine: A Universal Turing Machine for NLP》
介紹: 來(lái)自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy來(lái)刻畫NLP中各項(xiàng)任務(wù)的難度.
??? 《TThe Probabilistic Relevance Framework: BM25 and Beyond》
介紹: 信息檢索排序模型BM25(Besting Matching)。1)從經(jīng)典概率模型演變而來(lái) 2)捕捉了向量空間模型中三個(gè)影響索引項(xiàng)權(quán)重的因子:IDF逆文檔頻率;TF索引項(xiàng)頻率;文檔長(zhǎng)度歸一化。3)并且含有集成學(xué)習(xí)的思想:組合了BM11和BM15兩個(gè)模型。4)作者是BM25的提出者和Okapi實(shí)現(xiàn)者Robertson.
??? 《Introduction to ARMA Time Series Models – simplified》
介紹: 自回歸滑動(dòng)平均(ARMA)時(shí)間序列的簡(jiǎn)單介紹,ARMA是研究時(shí)間序列的重要方法,由自回歸模型(AR模型)與滑動(dòng)平均模型(MA模型)為基礎(chǔ)“混合”構(gòu)成.
??? 《Encoding Source Language with Convolutional Neural Network for Machine Translation》
介紹: 把來(lái)自target的attention signal加入source encoding CNN的輸入,得到了比BBN的模型好的多neural network joint model
??? 《Spices form the basis of food pairing in Indian cuisine》
介紹: 揭開印度菜的美味秘訣——通過對(duì)大量食譜原料關(guān)系的挖掘,發(fā)現(xiàn)印度菜美味的原因之一是其中的味道互相沖突,很有趣的文本挖掘研究
??? 《HMM相關(guān)文章索引》
介紹: HMM相關(guān)文章
??? 《Zipf's and Heap's law》
介紹: 1)詞頻與其降序排序的關(guān)系,最著名的是語(yǔ)言學(xué)家齊夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比關(guān)系. 曼德勃羅(Mandelbrot,1924- 2010)引入?yún)?shù)修正了對(duì)甚高頻和甚低頻詞的刻畫 2)Heaps' law: 詞匯表與語(yǔ)料規(guī)模的平方根(這是一個(gè)參數(shù),英語(yǔ)0.4-0.6)成正比
??? 《I am Jürgen Schmidhuber, AMA》
介紹: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主題,有不少RNN和AI、ML的干貨內(nèi)容,關(guān)于開源&思想&方法&建議……耐心閱讀,相信你也會(huì)受益匪淺.
??? 《學(xué)術(shù)種子網(wǎng)站:AcademicTorrents》
介紹: 成G上T的學(xué)術(shù)數(shù)據(jù),HN近期熱議話題,主題涉及機(jī)器學(xué)習(xí)、NLP、SNA等。下載最簡(jiǎn)單的方法,通過BT軟件,RSS訂閱各集合即可
??? 《機(jī)器學(xué)習(xí)交互速查表》
介紹: Scikit-Learn官網(wǎng)提供,在原有的Cheat Sheet基礎(chǔ)上加上了Scikit-Learn相關(guān)文檔的鏈接,方便瀏覽
??? 《A Full Hardware Guide to Deep Learning》
介紹: 深度學(xué)習(xí)的全面硬件指南,從GPU到RAM、CPU、SSD、PCIe
??? 《行人檢測(cè)(Pedestrian Detection)資源》
介紹:Pedestrian Detection paper & data
??? 《A specialized face-processing network consistent with the representational geometry of monkey face patches》
介紹: 【神經(jīng)科學(xué)碰撞人工智能】在臉部識(shí)別上你我都是專家,即使細(xì)微的差別也能辨認(rèn)。研究已證明人類和靈長(zhǎng)類動(dòng)物在面部加工上不同于其他物種,人類使用梭狀回面孔區(qū)(FFA)。Khaligh-Razavi等通過計(jì)算機(jī)模擬出人臉識(shí)別的FFA活動(dòng),堪稱神經(jīng)科學(xué)與人工智能的完美結(jié)合。
??? 《Neural Net in C++ Tutorial》
介紹: 神經(jīng)網(wǎng)絡(luò)C++教程,本文介紹了用可調(diào)節(jié)梯度下降和可調(diào)節(jié)動(dòng)量法設(shè)計(jì)和編碼經(jīng)典BP神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)經(jīng)過訓(xùn)練可以做出驚人和美妙的東西出來(lái)。此外作者博客的其他文章也很不錯(cuò)。
??? 《How to Choose a Neural Network》
介紹:deeplearning4j官網(wǎng)提供的實(shí)際應(yīng)用場(chǎng)景NN選擇參考表,列舉了一些典型問題建議使用的神經(jīng)網(wǎng)絡(luò)
??? 《Deep Learning (Python, C/C++, Java, Scala, Go)》
介紹:一個(gè)深度學(xué)習(xí)項(xiàng)目,提供了Python, C/C++, Java, Scala, Go多個(gè)版本的代碼
??? 《Deep Learning Tutorials》
介紹:深度學(xué)習(xí)教程
??? 《自然語(yǔ)言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授》
介紹:自然語(yǔ)言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授.
??? 《FaceNet: A Unified Embedding for Face Recognition and Clustering》
介紹:Google對(duì)Facebook DeepFace的有力回?fù)簟?FaceNet,在LFW(Labeled Faces in the Wild)上達(dá)到99.63%準(zhǔn)確率(新紀(jì)錄),FaceNet embeddings可用于人臉識(shí)別、鑒別和聚類.
??? 《MLlib中的Random Forests和Boosting》
介紹:本文來(lái)自Databricks公司網(wǎng)站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們?cè)贛Llib中的分布式實(shí)現(xiàn),以及展示一些簡(jiǎn)單的例子并建議該從何處上手.中文版.
??? 《Sum-Product Networks(SPN) 》
介紹:華盛頓大學(xué)Pedro Domingos團(tuán)隊(duì)的DNN,提供論文和實(shí)現(xiàn)代碼.
??? 《Neural Network Dependency Parser》
介紹:基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言依存關(guān)系解析器(已集成至Stanford CoreNLP),特點(diǎn)是超快、準(zhǔn)確,目前可處理中英文語(yǔ)料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路實(shí)現(xiàn).
??? 《神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型》
介紹:本文根據(jù)神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,詳細(xì)講解神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型在各個(gè)階段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結(jié)的特別好.
??? 《Classifying Spam Emails using Text and Readability Features》
介紹:經(jīng)典問題的新研究:利用文本和可讀性特征分類垃圾郵件。
??? 《BCI Challenge @ NER 2015》
介紹:Kaggle腦控計(jì)算機(jī)交互(BCI)競(jìng)賽優(yōu)勝方案源碼及文檔,包括完整的數(shù)據(jù)處理流程,是學(xué)習(xí)Python數(shù)據(jù)處理和Kaggle經(jīng)典參賽框架的絕佳實(shí)例
??? 《IPOL Journal · Image Processing On Line》
介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個(gè)算法及相應(yīng)的代碼、Demo和實(shí)驗(yàn)文檔。文本和源碼是經(jīng)過了同行評(píng)審的。IPOL是開放的科學(xué)和可重復(fù)的研究期刊。我一直想做點(diǎn)類似的工作,拉近產(chǎn)品和技術(shù)之間的距離.
??? 《Machine learning classification over encrypted data》
介紹:出自MIT,研究加密數(shù)據(jù)高效分類問題.
??? 《purine2》
介紹:新加坡LV實(shí)驗(yàn)室的神經(jīng)網(wǎng)絡(luò)并行框架Purine: A bi-graph based deep learning framework,支持構(gòu)建各種并行的架構(gòu),在多機(jī)多卡,同步更新參數(shù)的情況下基本達(dá)到線性加速。12塊Titan 20小時(shí)可以完成Googlenet的訓(xùn)練。
??? 《Machine Learning Resources》
介紹:這是一個(gè)機(jī)器學(xué)習(xí)資源庫(kù),雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個(gè)由zheng Rui整理的機(jī)器學(xué)習(xí)資源.
??? 《Hands-on with machine learning》
介紹:Chase Davis在NICAR15上的主題報(bào)告材料,用Scikit-Learn做監(jiān)督學(xué)習(xí)的入門例子.
??? 《The Natural Language Processing Dictionary》
介紹:這是一本自然語(yǔ)言處理的詞典,從1998年開始到目前積累了成千上萬(wàn)的專業(yè)詞語(yǔ)解釋,如果你是一位剛?cè)腴T的朋友.可以借這本詞典讓自己成長(zhǎng)更快.
??? 《PageRank Approach to Ranking National Football Teams》
介紹:通過分析1930年至今的比賽數(shù)據(jù),用PageRank計(jì)算世界杯參賽球隊(duì)排行榜.
??? 《R Tutorial》
介紹:R語(yǔ)言教程,此外還推薦一個(gè)R語(yǔ)言教程An Introduction to R.
??? 《Fast unfolding of communities in large networks》
介紹:經(jīng)典老文,復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的高效算法,Gephi中的Community detection即基于此.
??? 《NUML》
介紹: 一個(gè)面向 .net 的開源機(jī)器學(xué)習(xí)庫(kù),github地址
??? 《synaptic.Js》
介紹: 支持node.js的JS神經(jīng)網(wǎng)絡(luò)庫(kù),可在客戶端瀏覽器中運(yùn)行,支持LSTM等 github地址
??? 《Machine learning for package users with R (1): Decision Tree》
介紹: 決策樹
??? 《Deep Learning, The Curse of Dimensionality, and Autoencoders》
介紹: 討論深度學(xué)習(xí)自動(dòng)編碼器如何有效應(yīng)對(duì)維數(shù)災(zāi)難,國(guó)內(nèi)翻譯
??? 《Advanced Optimization and Randomized Methods》
介紹: CMU的優(yōu)化與隨機(jī)方法課程,由A. Smola和S. Sra主講,優(yōu)化理論是機(jī)器學(xué)習(xí)的基石,值得深入學(xué)習(xí) 國(guó)內(nèi)云(視頻)
??? 《CS231n: Convolutional Neural Networks for Visual Recognition》
介紹: "面向視覺識(shí)別的CNN"課程設(shè)計(jì)報(bào)告集錦.近百篇,內(nèi)容涉及圖像識(shí)別應(yīng)用的各個(gè)方面
??? 《Topic modeling with LDA: MLlib meets GraphX》
介紹:用Spark的MLlib+GraphX做大規(guī)模LDA主題抽取.
??? 《Deep Learning for Multi-label Classification》
介紹: 基于深度學(xué)習(xí)的多標(biāo)簽分類,用基于RBM的DBN解決多標(biāo)簽分類(特征)問題
??? 《Google DeepMind publications》
介紹: DeepMind論文集錦
??? 《kaldi》
介紹: 一個(gè)開源語(yǔ)音識(shí)別工具包,它目前托管在sourceforge上面
??? 《Data Journalism Handbook》
介紹: 免費(fèi)電子書《數(shù)據(jù)新聞手冊(cè)》, 國(guó)內(nèi)有熱心的朋友翻譯了中文版,大家也可以在線閱讀
??? 《Data Mining Problems in Retail》
介紹: 零售領(lǐng)域的數(shù)據(jù)挖掘文章.
??? 《Understanding Convolution in Deep Learning》
介紹: 深度學(xué)習(xí)卷積概念詳解,深入淺出.
??? 《pandas: powerful Python data analysis toolkit》
介紹: 非常強(qiáng)大的Python的數(shù)據(jù)分析工具包.
??? 《Text Analytics 2015》
介紹: 2015文本分析(商業(yè))應(yīng)用綜述.
??? 《Deep Learning libraries and ?rst experiments with Theano》
介紹: 深度學(xué)習(xí)框架、庫(kù)調(diào)研及Theano的初步測(cè)試體會(huì)報(bào)告.
??? 《DEEP learning》
介紹: MIT的Yoshua Bengio等人講深度學(xué)習(xí)的新書,還未定稿,線上提供Draft chapters收集反饋,超贊!強(qiáng)烈推薦.
??? 《simplebayes》
介紹: Python下開源可持久化樸素貝葉斯分類庫(kù).
??? 《Paracel》
介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
??? 《HanLP:Han Language processing》
介紹: 開源漢語(yǔ)言處理包.
??? 《Simple Neural Network implementation in Ruby》
介紹: 使用Ruby實(shí)現(xiàn)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)例子.
??? 《Hacker's guide to Neural Networks》
介紹:神經(jīng)網(wǎng)絡(luò)黑客入門.
??? 《The Open-Source Data Science Masters》
介紹:好多數(shù)據(jù)科學(xué)家名人推薦,還有資料.
??? 《Text Understanding from Scratch》
介紹:實(shí)現(xiàn)項(xiàng)目已經(jīng)開源在github上面Crepe
??? 《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
介紹:作者發(fā)現(xiàn),經(jīng)過調(diào)參,傳統(tǒng)的方法也能和word2vec取得差不多的效果。另外,無(wú)論作者怎么試,GloVe都比不過word2vec.
??? 《CS224d: Deep Learning for Natural Language Processing》
介紹:Stanford深度學(xué)習(xí)與自然語(yǔ)言處理課程,Richard Socher主講.
??? 《Math Essentials in Machine Learning》
介紹:機(jī)器學(xué)習(xí)中的重要數(shù)學(xué)概念.
??? 《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
介紹:用于改進(jìn)語(yǔ)義表示的樹型LSTM遞歸神經(jīng)網(wǎng)絡(luò),句子級(jí)相關(guān)性判斷和情感分類效果很好.實(shí)現(xiàn)代碼.
??? 《Statistical Machine Learning》
介紹:卡耐基梅隆Ryan Tibshirani和Larry Wasserman開設(shè)的機(jī)器學(xué)習(xí)課程,先修課程為機(jī)器學(xué)習(xí)(10-715)和中級(jí)統(tǒng)計(jì)學(xué)(36-705),聚焦統(tǒng)計(jì)理論和方法在機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用.
??? 《AM207: Monte Carlo Methods, Stochastic Optimization》
介紹:《哈佛大學(xué)蒙特卡洛方法與隨機(jī)優(yōu)化課程》是哈佛應(yīng)用數(shù)學(xué)研究生課程,由V Kaynig-Fittkau、P Protopapas主講,Python程序示例,對(duì)貝葉斯推理感興趣的朋友一定要看看,提供授課視頻及課上IPN講義.
??? 《生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用》
介紹:生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用.并且伯克利開源了他們的big data genomics系統(tǒng)ADAM,其他的內(nèi)容可以關(guān)注一下官方主頁(yè).
??? 《ACL Anthology》
介紹:對(duì)自然語(yǔ)言處理技術(shù)或者機(jī)器翻譯技術(shù)感興趣的親們,請(qǐng)?jiān)谔岢鲎约号1频綗o(wú)以倫比的idea(自動(dòng)歸納翻譯規(guī)律、自動(dòng)理解語(yǔ)境、自動(dòng)識(shí)別語(yǔ)義等等)之前,請(qǐng)通過谷歌學(xué)術(shù)簡(jiǎn)單搜一下,如果谷歌不可用,這個(gè)網(wǎng)址有這個(gè)領(lǐng)域幾大頂會(huì)的論文列表,切不可斷章取義,胡亂假設(shè).
??? 《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
介紹:論文+代碼:基于集成方法的Twitter情感分類,實(shí)現(xiàn)代碼.
??? 《NIPS 2014 CIML workshop》
介紹:NIPS CiML 2014的PPT,NIPS是神經(jīng)信息處理系統(tǒng)進(jìn)展大會(huì)的英文簡(jiǎn)稱.
??? 《CS231n: Convolutional Neural Networks for Visual Recognition》
介紹:斯坦福的深度學(xué)習(xí)課程的Projects 每個(gè)人都要寫一個(gè)論文級(jí)別的報(bào)告 里面有一些很有意思的應(yīng)用 大家可以看看 .
??? 《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
介紹:R語(yǔ)言線性回歸多方案速度比較具體方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.
??? 《Back-to-Basics Weekend Reading - Machine Learning》
介紹:文中提到的三篇論文(機(jī)器學(xué)習(xí)那些事、無(wú)監(jiān)督聚類綜述、監(jiān)督分類綜述)都很經(jīng)典,Domnigos的機(jī)器學(xué)習(xí)課也很精彩
??? 《A Probabilistic Theory of Deep Learning》
介紹:萊斯大學(xué)(Rice University)的深度學(xué)習(xí)的概率理論.
??? 《Nonsensical beer reviews via Markov chains》
介紹:基于馬爾可夫鏈自動(dòng)生成啤酒評(píng)論的開源Twitter機(jī)器人,github地址.
??? 《Deep Learning for Natural Language Processing (without Magic)》
介紹:視頻+講義:深度學(xué)習(xí)用于自然語(yǔ)言處理教程(NAACL13).
??? 《Introduction to Data Analysis using Machine Learning》
介紹:用機(jī)器學(xué)習(xí)做數(shù)據(jù)分析,David Taylor最近在McGill University研討會(huì)上的報(bào)告,還提供了一系列講機(jī)器學(xué)習(xí)方法的ipn,很有價(jià)值 GitHub.國(guó)內(nèi)
??? 《Beyond Short Snippets: Deep Networks for Video Classification》
介紹:基于CNN+LSTM的視頻分類,google演示.
??? 《How does Quora use machine learning in 2015?》
介紹:Quora怎么用機(jī)器學(xué)習(xí).
??? 《Amazon Machine Learning – Make Data-Driven Decisions at Scale》
介紹:亞馬遜在機(jī)器學(xué)習(xí)上面的一些應(yīng)用,代碼示例.
??? 《Parallel Machine Learning with scikit-learn and IPython》
介紹:并行機(jī)器學(xué)習(xí)指南(基于scikit-learn和IPython).notebook
??? 《Intro to machine learning with scikit-learn》
介紹:DataSchool的機(jī)器學(xué)習(xí)基本概念教學(xué).
??? 《DeepCLn》
介紹:一個(gè)基于OpenGL實(shí)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò),支持Linux及Windows系.
??? 《An Inside Look at the Components of a Recommendation Engine》
介紹:基于Mahout和Elasticsearch的推薦系統(tǒng).
??? 《Forecasting in Economics, Business, Finance and Beyond》
介紹:Francis X. Diebold的《(經(jīng)濟(jì)|商業(yè)|金融等領(lǐng)域)預(yù)測(cè)方法.
??? 《Time Series Econometrics - A Concise Course》
介紹:Francis X. Diebold的《時(shí)序計(jì)量經(jīng)濟(jì)學(xué)》.
??? 《A comparison of open source tools for sentiment analysis》
介紹:基于Yelp數(shù)據(jù)集的開源情感分析工具比較,評(píng)測(cè)覆蓋Naive Bayes、SentiWordNet、CoreNLP等 .
??? 《Pattern Recognition And Machine Learning》
介紹:國(guó)內(nèi)Pattern Recognition And Machine Learning讀書會(huì)資源匯總,各章pdf講稿,博客.
??? 《Probabilistic Data Structures for Web Analytics and Data Mining 》
介紹:用于Web分析和數(shù)據(jù)挖掘的概率數(shù)據(jù)結(jié)構(gòu).
??? 《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》
介紹:機(jī)器學(xué)習(xí)在導(dǎo)航上面的應(yīng)用.
??? 《Neural Networks Demystified 》
介紹:Neural Networks Demystified系列視頻,Stephen Welch制作,純手繪風(fēng)格,淺顯易懂,國(guó)內(nèi)云.
??? 《swirl + DataCamp 》
介紹:{swirl}數(shù)據(jù)訓(xùn)練營(yíng):R&數(shù)據(jù)科學(xué)在線交互教程.
??? 《Learning to Read with Recurrent Neural Networks 》
介紹:關(guān)于深度學(xué)習(xí)和RNN的討論 Sequence to Sequence Learning with Neural Networks.
??? 《深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的資源》
介紹:Deep Reinforcement Learning.
??? 《Machine Learning with Scikit-Learn》
介紹:(PyCon2015)Scikit-Learn機(jī)器學(xué)習(xí)教程,Parallel Machine Learning with scikit-learn and IPython.
??? 《PDNN》
介紹:PDNN: A Python Toolkit for Deep Learning.
??? 《Introduction to Machine Learning》
介紹:15年春季學(xué)期CMU的機(jī)器學(xué)習(xí)課程,由Alex Smola主講,提供講義及授課視頻,很不錯(cuò).國(guó)內(nèi)鏡像.
??? 《Big Data Processing》
介紹:大數(shù)據(jù)處理課.內(nèi)容覆蓋流處理、MapReduce、圖算法等.
??? 《Spark MLlib: Making Practical Machine Learning Easy and Scalable》
介紹:用Spark MLlib實(shí)現(xiàn)易用可擴(kuò)展的機(jī)器學(xué)習(xí),國(guó)內(nèi)鏡像.
??? 《Picture: A Probabilistic Programming Language for Scene Perception》
介紹:以往上千行代碼概率編程(語(yǔ)言)實(shí)現(xiàn)只需50行.
??? 《Beautiful plotting in R: A ggplot2 cheatsheet》
介紹:ggplot2速查小冊(cè)子,另外一個(gè),此外還推薦《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.
??? 《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》
介紹:用結(jié)構(gòu)化模型來(lái)預(yù)測(cè)實(shí)時(shí)股票行情.
??? 《International Joint Conference on Artificial Intelligence Accepted paper》
介紹:國(guó)際人工智能聯(lián)合會(huì)議錄取論文列表,大部分論文可使用Google找到.
??? 《Why GEMM is at the heart of deep learning》
介紹:一般矩陣乘法(GEMM)對(duì)深度學(xué)習(xí)的重要性.
??? 《Distributed (Deep) Machine Learning Common》
介紹:A Community of awesome Distributed Machine Learning C++ projects.
??? 《Reinforcement Learning: An Introduction》
介紹:免費(fèi)電子書<強(qiáng)化學(xué)習(xí)介紹>,第一版(1998),第二版(2015草稿),相關(guān)課程資料,Reinforcement Learning.
??? 《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》
介紹:免費(fèi)書:Azure ML使用精要.
??? 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介紹:A Deep Learning Tutorial: From Perceptrons to Deep Networks.
??? 《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》
介紹:有趣的機(jī)器學(xué)習(xí):最簡(jiǎn)明入門指南,中文版.
??? 《A Brief Overview of Deep Learning》
介紹:深度學(xué)習(xí)簡(jiǎn)明介紹,中文版.
??? 《Wormhole》
介紹:Portable, scalable and reliable distributed machine learning.
??? 《convnet-benchmarks》
介紹:CNN開源實(shí)現(xiàn)橫向評(píng)測(cè),參評(píng)框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表現(xiàn)突出.
??? 《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》
介紹:卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院語(yǔ)言技術(shù)系的資源大全,包括大量的NLP開源軟件工具包,基礎(chǔ)數(shù)據(jù)集,論文集,數(shù)據(jù)挖掘教程,機(jī)器學(xué)習(xí)資源.
??? 《Sentiment Analysis on Twitter》
介紹:Twitter情感分析工具SentiTweet,視頻+講義.
??? 《Machine Learning Repository @ Wash U》
介紹:華盛頓大學(xué)的Machine Learning Paper Repository.
??? 《Machine learning cheat sheet》
介紹:機(jī)器學(xué)習(xí)速查表.
??? 《Spark summit east 2015 agenda》
介紹:最新的Spark summit會(huì)議資料.
??? 《Spark summit east 2015 agenda》
介紹:最新的Spark summit會(huì)議資料.
??? 《Learning Spark》
介紹:Ebook Learning Spark.
??? 《Advanced Analytics with Spark, Early Release Edition》
介紹:Ebook Advanced Analytics with Spark, Early Release Edition.
??? 《國(guó)內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:唐杰》
介紹:清華大學(xué)副教授,是圖挖掘方面的專家。他主持設(shè)計(jì)和實(shí)現(xiàn)的Arnetminer是國(guó)內(nèi)領(lǐng)先的圖挖掘系統(tǒng),該系統(tǒng)也是多個(gè)會(huì)議的支持商.
??? 《國(guó)內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:楊強(qiáng)》
介紹:遷移學(xué)習(xí)的國(guó)際領(lǐng)軍人物.
??? 《國(guó)內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:周志華》
介紹:在半監(jiān)督學(xué)習(xí),multi-label學(xué)習(xí)和集成學(xué)習(xí)方面在國(guó)際上有一定的影響力.
??? 《國(guó)內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:王海峰》
介紹:信息檢索,自然語(yǔ)言處理,機(jī)器翻譯方面的專家.
??? 《國(guó)內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:吳軍》
介紹:吳軍博士是當(dāng)前Google中日韓文搜索算法的主要設(shè)計(jì)者。在Google其間,他領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語(yǔ)言處理的項(xiàng)目,他的新個(gè)人主頁(yè).
??? 《Cat Paper Collection》
介紹:喵星人相關(guān)論文集.
??? 《How to Evaluate Machine Learning Models, Part 1: Orientation》
介紹:如何評(píng)價(jià)機(jī)器學(xué)習(xí)模型系列文章,How to Evaluate Machine Learning Models, Part 2a: Classification Metrics,How to Evaluate Machine Learning Models, Part 2b: Ranking and Regression Metrics.
??? 《Building a new trends experience》
介紹:Twitter新trends的基本實(shí)現(xiàn)框架.
??? 《Storm Blueprints: Patterns for Distributed Real-time Computation》
介紹:Storm手冊(cè),國(guó)內(nèi)有中文翻譯版本,謝謝作者.
參考文獻(xiàn):https://github.com/ty4z2008/Qix/blob/master/dl.md
 ??? 《Brief History of Machine Learning》
 介紹:這是一篇介紹機(jī)器學(xué)習(xí)歷史的文章,介紹很全面,從感知機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹、SVM、Adaboost到隨機(jī)森林、Deep Learning.
??? 《Deep Learning in Neural Networks: An Overview》
 介紹:這是瑞士人工智能實(shí)驗(yàn)室Jurgen Schmidhuber寫的最新版本《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)綜述》本綜述的特點(diǎn)是以時(shí)間排序,從1940年開始講起,到60-80年代,80-90年代,一直講到2000年后及最近幾年的進(jìn)展。涵蓋了deep learning里各種tricks,引用非常全面.
??? 《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》
 介紹:這是一份python機(jī)器學(xué)習(xí)庫(kù),如果您是一位python工程師而且想深入的學(xué)習(xí)機(jī)器學(xué)習(xí).那么這篇文章或許能夠幫助到你.
??? 《How to Layout and Manage Your Machine Learning Project》
 介紹:這一篇介紹如果設(shè)計(jì)和管理屬于你自己的機(jī)器學(xué)習(xí)項(xiàng)目的文章,里面提供了管理模版、數(shù)據(jù)管理與實(shí)踐方法.
??? 《Machine Learning is Fun!》
 介紹:如果你還不知道什么是機(jī)器學(xué)習(xí),或則是剛剛學(xué)習(xí)感覺到很枯燥乏味。那么推薦一讀。這篇文章已經(jīng)被翻譯成中文,如果有興趣可以移步http://blog.jobbole.com/67616/
??? 《R語(yǔ)言參考卡片》
 介紹:R語(yǔ)言是機(jī)器學(xué)習(xí)的主要語(yǔ)言,有很多的朋友想學(xué)習(xí)R語(yǔ)言,但是總是忘記一些函數(shù)與關(guān)鍵字的含義。那么這篇文章或許能夠幫助到你
??? 《Choosing a Machine Learning Classifier》
 介紹:我該如何選擇機(jī)器學(xué)習(xí)算法,這篇文章比較直觀的比較了Naive Bayes,Logistic Regression,SVM,決策樹等方法的優(yōu)劣,另外討論了樣本大小、Feature與Model權(quán)衡等問題。此外還有已經(jīng)翻譯了的版本:http://www.52ml.net/15063.html
??? 《An Introduction to Deep Learning: From Perceptrons to Deep Networks》
 介紹:深度學(xué)習(xí)概述:從感知機(jī)到深度網(wǎng)絡(luò),作者對(duì)于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html
??? 《The LION Way: Machine Learning plus Intelligent Optimization》
??? 介紹:<機(jī)器學(xué)習(xí)與優(yōu)化>這是一本機(jī)器學(xué)習(xí)的小冊(cè)子, 短短300多頁(yè)道盡機(jī)器學(xué)習(xí)的方方面面. 圖文并茂, 生動(dòng)易懂, 沒有一坨坨公式的煩惱. 適合新手入門打基礎(chǔ), 也適合老手溫故而知新. 比起MLAPP/PRML等大部頭, 也許這本你更需要!具體內(nèi)容推薦閱讀:http://intelligent-optimization.org/LIONbook/
 ??? 《深度學(xué)習(xí)與統(tǒng)計(jì)學(xué)習(xí)理論》
 介紹:作者是來(lái)自百度,不過他本人已經(jīng)在2014年4月份申請(qǐng)離職了。但是這篇文章很不錯(cuò)如果你不知道深度學(xué)習(xí)與支持向量機(jī)/統(tǒng)計(jì)學(xué)習(xí)理論有什么聯(lián)系?那么應(yīng)該立即看看這篇文章.
??? 《計(jì)算機(jī)科學(xué)中的數(shù)學(xué)》
 介紹:這本書是由谷歌公司和MIT共同出品的計(jì)算機(jī)科學(xué)中的數(shù)學(xué):[Mathematics for Computer Science](Mathematics for Computer Science),Eric Lehman et al 2013 。分為5大部分:1)證明,歸納。2)結(jié)構(gòu),數(shù)論,圖。3)計(jì)數(shù),求和,生成函數(shù)。4)概率,隨機(jī)行走。5)遞歸。等等
??? 《信息時(shí)代的計(jì)算機(jī)科學(xué)理論(Foundations of Data Science)》
 介紹:信息時(shí)代的計(jì)算機(jī)科學(xué)理論,目前國(guó)內(nèi)有紙質(zhì)書購(gòu)買,iTunes購(gòu)買
??? 《Data Science with R》
 介紹:這是一本由雪城大學(xué)新編的第二版《數(shù)據(jù)科學(xué)入門》教材:偏實(shí)用型,淺顯易懂,適合想學(xué)習(xí)R語(yǔ)言的同學(xué)選讀。
??? 《Twenty Questions for Donald Knuth》
 介紹:這并不是一篇文檔或書籍。這是篇向圖靈獎(jiǎng)得主Donald Knuth提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20個(gè)問題,內(nèi)容包括TAOCP,P/NP問題,圖靈機(jī),邏輯,以及為什么大神不用電郵等等。
??? 《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》
 介紹:不會(huì)統(tǒng)計(jì)怎么辦?不知道如何選擇合適的統(tǒng)計(jì)模型怎么辦?那這篇文章你的好好讀一讀了麻省理工Joshua B. Tenenbaum和劍橋Zoubin Ghahramani合作,寫了一篇關(guān)于automatic statistician的文章。可以自動(dòng)選擇回歸模型類別,還能自動(dòng)寫報(bào)告...
??? 《ICLR 2014論文集》
 介紹:對(duì)深度學(xué)習(xí)和representation learning最新進(jìn)展有興趣的同學(xué)可以了解一下
??? 《Introduction to Information Retrieval》
 介紹:這是一本信息檢索相關(guān)的書籍,是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的信息檢索教材之一。最近作者增加了該課程的幻燈片和作業(yè)。IR相關(guān)資源:http://www-nlp.stanford.edu/IR ... .html
??? 《Machine learning in 10 pictures》
 介紹:Deniz Yuret用10張漂亮的圖來(lái)解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰
??? 《雅虎研究院的數(shù)據(jù)集匯總》
 介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語(yǔ)言類數(shù)據(jù),圖與社交類數(shù)據(jù),評(píng)分與分類數(shù)據(jù),計(jì)算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競(jìng)賽數(shù)據(jù),以及系統(tǒng)類的數(shù)據(jù)。
??? 《An Introduction to Statistical Learning with Applications in R》
 介紹:這是一本斯坦福統(tǒng)計(jì)學(xué)著名教授Trevor Hastie和Robert Tibshirani的新書,并且在2014年一月已經(jīng)開課:https://class.stanford.edu/cou ... about
??? Best Machine Learning Resources for Getting Started
 介紹:機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總是專為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。
??? My deep learning reading list
 介紹:主要是順著Bengio的PAMI review的文章找出來(lái)的。包括幾本綜述文章,將近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。
??? Cross-Language Information Retrieval
 介紹:這是一本書籍,主要介紹的是跨語(yǔ)言信息檢索方面的知識(shí)。理論很多
??? 探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探
 介紹:本文共有三個(gè)系列,作者是來(lái)自IBM的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實(shí)現(xiàn)這些算法。探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類
??? 《Advice for students of machine learning》
 介紹:康奈爾大學(xué)信息科學(xué)系助理教授David Mimno寫的《對(duì)機(jī)器學(xué)習(xí)初學(xué)者的一點(diǎn)建議》, 寫的挺實(shí)際,強(qiáng)調(diào)實(shí)踐與理論結(jié)合,最后還引用了馮 ? 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
??? 分布式并行處理的數(shù)據(jù)
 介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。著重介紹了各種神級(jí)網(wǎng)絡(luò)算法的分布式實(shí)現(xiàn),做Distributed Deep Learning 的童鞋可以參考下
??? 《“機(jī)器學(xué)習(xí)”是什么?》
 介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt是微軟研究院杰出科學(xué)家,17年來(lái)他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來(lái)機(jī)器學(xué)習(xí)變得炙手可熱,Platt和同事們遂決定開設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來(lái)看Platt的這篇博文
??? 《2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)ICML 2014 論文》
 介紹:2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)(ICML)已經(jīng)于6月21-26日在國(guó)家會(huì)議中心隆重舉辦。本次大會(huì)由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這個(gè)有著30多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會(huì)首次來(lái)到中國(guó),已成功吸引海內(nèi)外1200多位學(xué)者的報(bào)名參與。干貨很多,值得深入學(xué)習(xí)下
??? 《Machine Learning for Industry: A Case Study》
 介紹:這篇文章主要是以Learning to Rank為例說(shuō)明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet對(duì)NDCG之類不敏感,加入NDCG因素后變成了LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò)改為應(yīng)用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表論文為:
 From RankNet to LambdaRank to LambdaMART: An Overview
 此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning
??? 100 Best GitHub: Deep Learning
 介紹:100 Best GitHub: Deep Learning
??? 《UFLDL-斯坦福大學(xué)Andrew Ng教授“Deep Learning”教程》
 介紹:本教程將闡述無(wú)監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點(diǎn)。通過學(xué)習(xí),你也將實(shí)現(xiàn)多個(gè)功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?#xff0c;并學(xué)習(xí)如何應(yīng)用/適應(yīng)這些想法到新問題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(shí)(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第II,III,IV章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在github上面已經(jīng)有python版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介紹:這份文檔來(lái)自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過有些地方會(huì)讓人眼前一亮,毛塞頓開。
??? Understanding Convolutions
 介紹:這是一篇介紹圖像卷積運(yùn)算的文章,講的已經(jīng)算比較詳細(xì)的了
??? 《Machine Learning Summer School》
 介紹:每天請(qǐng)一個(gè)大牛來(lái)講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計(jì)算以及人腦研究。https://www.youtube.com/user/smolix (需翻墻)
??? 《Awesome Machine Learning》
 介紹:一個(gè)超級(jí)完整的機(jī)器學(xué)習(xí)開源庫(kù)總結(jié),如果你認(rèn)為這個(gè)碉堡了,那后面這個(gè)列表會(huì)更讓你驚訝:【Awesome Awesomeness】,國(guó)內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費(fèi)電子書
??? 斯坦福《自然語(yǔ)言處理》課程視頻
 介紹:ACL候任主席、斯坦福大學(xué)計(jì)算機(jī)系Chris Manning教授的《自然語(yǔ)言處理》課程所有視頻已經(jīng)可以在斯坦福公開課網(wǎng)站上觀看了(如Chrome不行,可用IE觀看) 作業(yè)與測(cè)驗(yàn)也可以下載。
??? 《Deep Learning and Shallow Learning》
 介紹:對(duì)比 Deep Learning 和 Shallow Learning 的好文,來(lái)著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。
??? 《Recommending music on Spotify with deep learning》
 介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂推薦。
??? 《Neural Networks and Deep Learning》
 介紹:神經(jīng)網(wǎng)絡(luò)的免費(fèi)在線書,已經(jīng)寫了三章了,還有對(duì)應(yīng)的開源代碼:https://github.com/mnielsen/ne ... rning 愛好者的福音。
??? 《Java Machine Learning》
 介紹:Java機(jī)器學(xué)習(xí)相關(guān)平臺(tái)和開源的機(jī)器學(xué)習(xí)庫(kù),按照大數(shù)據(jù)、NLP、計(jì)算機(jī)視覺和Deep Learning分類進(jìn)行了整理。看起來(lái)挺全的,Java愛好者值得收藏。
??? 《Machine Learning Theory: An Introductory Primer》
 介紹:機(jī)器學(xué)習(xí)最基本的入門文章,適合零基礎(chǔ)者
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
 介紹:機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來(lái)的。這里,我們從兩個(gè)方面來(lái)給大家介紹,第一個(gè)方面是學(xué)習(xí)的方式,第二個(gè)方面是算法的類似性。
??? 《機(jī)器學(xué)習(xí)經(jīng)典論文/survey合集》
 介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒錯(cuò)。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。
??? 《機(jī)器學(xué)習(xí)視頻庫(kù)》
 介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語(yǔ)底子。
??? 《機(jī)器學(xué)習(xí)經(jīng)典書籍》
 介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書籍,可做為入門參考書單。
??? 《16 Free eBooks On Machine Learning》
 介紹:16本機(jī)器學(xué)習(xí)的電子書,可以下載下來(lái)在pad,手機(jī)上面任意時(shí)刻去閱讀。不多我建議你看完一本再下載一本。
??? 《A Large set of Machine Learning Resources for Beginners to Mavens》
 介紹:標(biāo)題很大,從新手到專家。不過看完上面所有資料。肯定是專家了
??? 《機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總》
 介紹:入門的書真的很多,而且我已經(jīng)幫你找齊了。
??? 《Sibyl》
 介紹:Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如 YouTube 的視頻推薦。
??? 《Deep Learning》
 介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著
??? 《Neural Network & Text Mining》
 介紹:關(guān)于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結(jié)
??? 《前景目標(biāo)檢測(cè)1(總結(jié))》
 介紹:計(jì)算機(jī)視覺入門之前景目標(biāo)檢測(cè)1(總結(jié))
??? 《行人檢測(cè)》
 介紹:計(jì)算機(jī)視覺入門之行人檢測(cè)
??? 《Deep Learning – important resources for learning and understanding》
 介紹:Important resources for learning and understanding . Is awesome
??? 《Machine Learning Theory: An Introductory Primer》
 介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門文章。值得一讀
??? 《Neural Networks and Deep Learning》
 介紹:在線Neural Networks and Deep Learning電子書
??? 《Python 網(wǎng)頁(yè)爬蟲 & 文本處理 & 科學(xué)計(jì)算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》
 介紹:python的17個(gè)關(guān)于機(jī)器學(xué)習(xí)的工具
??? 《神奇的伽瑪函數(shù)(上)》
 介紹:下集在這里神奇的伽瑪函數(shù)(下)
??? 《分布式機(jī)器學(xué)習(xí)的故事》
 介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在google任研究。這篇文章王益博士7年來(lái)從谷歌到騰訊對(duì)于分布機(jī)器學(xué)習(xí)的所見所聞。值得細(xì)讀
??? 《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》
 介紹:把機(jī)器學(xué)習(xí)提升的級(jí)別分為0~4級(jí),每級(jí)需要學(xué)習(xí)的教材和掌握的知識(shí)。這樣,給機(jī)器學(xué)習(xí)者提供一個(gè)上進(jìn)的路線圖,以免走彎路。另外,整個(gè)網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。
??? 《Machine Learning Surveys》
 介紹:機(jī)器學(xué)習(xí)各個(gè)方向綜述的網(wǎng)站
??? 《Deep Learning Reading list》
 介紹:深度學(xué)習(xí)閱資源列表
??? 《Deep Learning: Methods and Applications》
 介紹:這是一本來(lái)自微的研究員 li Peng和Dong Yu所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書
??? 《Machine Learning Summer School 2014》
 介紹:2014年七月CMU舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束 有近50小時(shí)的視頻、十多個(gè)PDF版幻燈片,覆蓋 深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性 等熱點(diǎn)話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有CMU李沐 .(1080P高清喲)
??? 《Sibyl: 來(lái)自Google的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》
 介紹:在今年的IEEE/IFIP可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國(guó)際會(huì)議上,Google軟件工程師Tushar Chandra做了一個(gè)關(guān)于Sibyl系統(tǒng)的主題演講。 Sibyl是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如YouTube的視頻推薦。詳情請(qǐng)閱讀google sibyl
??? 《Building a deeper understanding of images》
 介紹:谷歌研究院的Christian Szegedy在谷歌研究院的博客上簡(jiǎn)要地介紹了他們今年參加ImageNet取得好成績(jī)的GoogLeNet系統(tǒng).是關(guān)于圖像處理的。
??? 《Bayesian network 與python概率編程實(shí)戰(zhàn)入門》
 介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語(yǔ)言與貝葉斯方法實(shí)踐
??? 《AMA: Michael I Jordan》
 介紹:網(wǎng)友問伯克利機(jī)器學(xué)習(xí)大牛、美國(guó)雙料院士Michael I. Jordan:"如果你有10億美金,你怎么花?Jordan: "我會(huì)用這10億美金建造一個(gè)NASA級(jí)別的自然語(yǔ)言處理研究項(xiàng)目。"
??? 《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理)》
 介紹:常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理,此外作者還有一些其他的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘文章和深度學(xué)習(xí)文章,不僅是理論還有源碼。
??? 《文本與數(shù)據(jù)挖掘視頻匯總》
 介紹:Videolectures上最受歡迎的25個(gè)文本與數(shù)據(jù)挖掘視頻匯總
??? 《怎么選擇深度學(xué)習(xí)的GPUs》
 介紹:在Kaggle上經(jīng)常取得不錯(cuò)成績(jī)的Tim Dettmers介紹了他自己是怎么選擇深度學(xué)習(xí)的GPUs, 以及個(gè)人如何構(gòu)建深度學(xué)習(xí)的GPU集群: http://t.cn/RhpuD1G
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:深度模型》
 介紹:對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan
??? 《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》
 介紹:還有2,3部分。http://blog.sina.com.cn/s/blog ... .html
??? 《Deep Learning 教程翻譯》
 介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國(guó)內(nèi)的機(jī)器學(xué)習(xí)愛好者很熱心的把這個(gè)教程翻譯成了中文。如果你英語(yǔ)不好,可以看看這個(gè)
??? 《Deep Learning 101》
 介紹:因?yàn)榻鼉赡陙?lái),深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實(shí)很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!
??? 《UFLDL Tutorial》
 介紹:這是斯坦福大學(xué)做的一免費(fèi)課程(很勉強(qiáng)),這個(gè)可以給你在深度學(xué)習(xí)的路上給你一個(gè)學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實(shí)際環(huán)境中。中文版
??? 《Toronto Deep Learning Demos》
 介紹:這是多倫多大學(xué)做的一個(gè)深度學(xué)習(xí)用來(lái)識(shí)別圖片標(biāo)簽/圖轉(zhuǎn)文字的demo。是一個(gè)實(shí)際應(yīng)用案例。有源碼
??? 《Deep learning from the bottom up》
 介紹:機(jī)器學(xué)習(xí)模型,閱讀這個(gè)內(nèi)容需要有一定的基礎(chǔ)。
??? 《R工具包的分類匯總》
 介紹: (CRAN Task Views, 34種常見任務(wù),每個(gè)任務(wù)又各自分類列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語(yǔ)言處理,時(shí)間序列分析,空間信息分析,多重變量分析,計(jì)量經(jīng)濟(jì)學(xué),心理統(tǒng)計(jì)學(xué),社會(huì)學(xué)統(tǒng)計(jì),化學(xué)計(jì)量學(xué),環(huán)境科學(xué),藥物代謝動(dòng)力學(xué) 等
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
 介紹: 機(jī)器學(xué)習(xí)無(wú)疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.
??? 《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
 介紹: 很多干貨,而且作者還總結(jié)了好幾個(gè)系列。另外還作者還了一個(gè)文章導(dǎo)航.非常的感謝作者總結(jié)。
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)
DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)
??? 《Tutorials Session A - Deep Learning for Computer Vision》
 介紹:傳送理由:Rob Fergus的用深度學(xué)習(xí)做計(jì)算機(jī)是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載 他是紐約大學(xué)教授,目前也在Facebook工作,他2014年的8篇論文
??? 《FudanNLP》
 介紹:FudanNLP,這是一個(gè)復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院開發(fā)的開源中文自然語(yǔ)言處理(NLP)工具包
 Fudan NLP里包含中文分詞、關(guān)鍵詞抽取、命名實(shí)體識(shí)別、詞性標(biāo)注、時(shí)間詞抽取、語(yǔ)法分析等功能,對(duì)搜索引擎 文本分析等極為有價(jià)值。
??? 《Open Sourcing ml-ease》
 介紹:LinkedIn 開源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點(diǎn)是 logistic regression 算法
??? 《機(jī)器學(xué)習(xí)周刊》
 介紹:對(duì)于英語(yǔ)不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個(gè)大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國(guó)內(nèi)愛好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識(shí)別、人工智能、機(jī)器人等等。謝謝作者
??? 《線性代數(shù)》
 介紹:《線性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實(shí)《線代》這門課講得淺顯易懂特別不容易,如果一上來(lái)就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個(gè)人推薦的最佳《線性代數(shù)》課程是麻省理工Gilbert Strang教授的課程。 課程主頁(yè)
??? 《Big-data》
 介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲(chǔ)、機(jī)器學(xué)習(xí)等。很贊的資源匯總。
??? 《machine learning for smart dummies》
 介紹:雅虎邀請(qǐng)了一名來(lái)自本古里安大學(xué)的訪問學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為7期,詳細(xì)講解了有關(guān)SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識(shí)。
??? 《Entanglement-Based Quantum Machine Learning》
 介紹:應(yīng)對(duì)大數(shù)據(jù)時(shí)代,量子機(jī)器學(xué)習(xí)的第一個(gè)實(shí)驗(yàn) paper 下載
??? 《How a Math Genius Hacked OkCupid to Find True Love》
 介紹:Wired雜志報(bào)道了UCLA數(shù)學(xué)博士Chris McKinlay (圖1)通過大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對(duì)算法找到真愛的故事,通過Python腳本控制著12個(gè)賬號(hào),下載了婚戀網(wǎng)站2萬(wàn)女用戶的600萬(wàn)問題答案,對(duì)他們進(jìn)行了統(tǒng)計(jì)抽樣及聚類分析(圖2,3),最后終于收獲了真愛。科技改變命運(yùn)!
??? 《Underactuated Robotics》
 介紹:MIT的Underactuated Robotics于 2014年10月1日開課,該課屬于MIT研究生級(jí)別的課程,對(duì)機(jī)器人和非線性動(dòng)力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門課程!
??? 《mllib實(shí)踐經(jīng)驗(yàn)(1)》
 介紹:mllib實(shí)踐經(jīng)驗(yàn)分享
??? 《Google Turns To Deep Learning Classification To Fight Web Spam》
 介紹:Google用Deep Learning做的antispam(反垃圾郵件)
??? 《NLP常用信息資源》
 介紹:NLP常用信息資源* 《NLP常用信息資源》
??? 《機(jī)器學(xué)習(xí)速查表》
 介紹:機(jī)器學(xué)習(xí)速查表
??? 《Best Papers vs. Top Cited Papers in Computer Science》
 介紹:從1996年開始在計(jì)算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文
??? 《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》
 介紹:把今年的一個(gè)ACM Trans. on Graphics (TOG)論文中的代碼整理為一個(gè)開源的算法框架,共享出來(lái)了。歡迎大家使用。可以實(shí)時(shí)的采集3D數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會(huì)后續(xù)公開。
??? 《Hacker's guide to Neural Networks》
 介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開源項(xiàng)目convnetjs作者karpathy告訴你,最佳技巧是,當(dāng)你開始寫代碼,一切將變得清晰。他剛發(fā)布了一本圖書,不斷在線更新
??? 《Building a Production Machine Learning Infrastructure》
 介紹:前Google廣告系統(tǒng)工程師Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實(shí)話
??? 《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
 介紹:使用Neo4j 做電影評(píng)論的情感分析。
??? 《DeepLearning.University – An Annotated Deep Learning Bibliography》
 介紹:不僅是資料,而且還對(duì)有些資料做了注釋。
??? 《A primer on deeping learning》
 介紹:深度學(xué)習(xí)入門的初級(jí)讀本
??? 《Machine learning is teaching us the secret to teaching 》
 介紹:機(jī)器學(xué)習(xí)教會(huì)了我們什么?
??? 《scikit-learn:用于機(jī)器學(xué)習(xí)的Python模塊》
 介紹:scikit-learn是在SciPy基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的Python模塊。
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:解析領(lǐng)域中各類模型》
 介紹:喬丹教授(Michael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對(duì)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問的問題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類模型,喬丹教授對(duì)此一一做了解釋和展望。
??? 《A*搜索算法的可視化短教程》
 介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點(diǎn)的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點(diǎn)到頂點(diǎn)n的實(shí)際代價(jià),h(n)是頂點(diǎn)n到目標(biāo)頂點(diǎn)的估算代價(jià)。合集
??? 《基于云的自然語(yǔ)言處理開源項(xiàng)目FudanNLP》
 介紹:本項(xiàng)目利用了Microsoft Azure,可以在幾分種內(nèi)完成NLP on Azure Website的部署,立即開始對(duì)FNLP各種特性的試用,或者以REST API的形式調(diào)用FNLP的語(yǔ)言分析功能
??? 《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》
 介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計(jì)算機(jī)軟件博士生導(dǎo)師。計(jì)算機(jī)科學(xué)研究所副所長(zhǎng).內(nèi)部課程
??? 《機(jī)器學(xué)習(xí)入門資源不完全匯總》》
 介紹:好東西的干貨真的很多
??? 《收集從2014年開始深度學(xué)習(xí)文獻(xiàn)》
 介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計(jì)算等,Amund Tveit等維護(hù)了一個(gè)DeepLearning.University小項(xiàng)目:收集從2014年開始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點(diǎn),github
??? 《EMNLP上兩篇關(guān)于股票趨勢(shì)的應(yīng)用論文 》
 介紹:EMNLP上兩篇關(guān)于stock trend 用到了deep model組織特征; Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。
??? 《Bengio組(蒙特利爾大學(xué)LISA組)深度學(xué)習(xí)教程 》
 介紹:作者是深度學(xué)習(xí)一線大牛Bengio組寫的教程,算法深入顯出,還有實(shí)現(xiàn)代碼,一步步展開。
??? 《學(xué)習(xí)算法的Neural Turing Machine 》
 介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí)function,不過谷歌目前有開始學(xué)習(xí)算法的趨勢(shì)。谷歌另外的這篇學(xué)習(xí)Python程序的Learning to Execute也有相似之處
??? 《Learning to Rank for Information Retrieval and Natural Language Processing》
 介紹:作者是華為技術(shù)有限公司,諾亞方舟實(shí)驗(yàn)室,首席科學(xué)家的李航博士寫的關(guān)于信息檢索與自然語(yǔ)言處理的文章
??? 《Rumor has it: Identifying Misinformation in Microblogs》
 介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個(gè)。一個(gè)是識(shí)別垃圾與虛假信息的paper.還有一個(gè)是網(wǎng)絡(luò)輿情及其分析技術(shù)
??? 《R機(jī)器學(xué)習(xí)實(shí)踐》
 介紹:該課程是網(wǎng)易公開課的收費(fèi)課程,不貴,超級(jí)便宜。主要適合于對(duì)利用R語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。
??? 《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化》
 介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer實(shí)現(xiàn)基于Hadoop的擴(kuò)展,第三代如Spark和Storm實(shí)現(xiàn)了實(shí)時(shí)和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP
??? 《圖像處理,分析與機(jī)器視覺》
 介紹:講計(jì)算機(jī)視覺的四部奇書(應(yīng)該叫經(jīng)典吧)之一,另外三本是Hartley的《多圖幾何》、Gonzalez的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》
??? 《LinkedIn最新的推薦系統(tǒng)文章Browsemaps》
 介紹:里面基本沒涉及到具體算法,但作者介紹了CF在LinkedIn的很多應(yīng)用,以及他們?cè)谧鐾扑]過程中獲得的一些經(jīng)驗(yàn)。最后一條經(jīng)驗(yàn)是應(yīng)該監(jiān)控log數(shù)據(jù)的質(zhì)量,因?yàn)橥扑]的質(zhì)量很依賴數(shù)據(jù)的質(zhì)量!
??? 《初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料》
 介紹:初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料
??? 《樹莓派的人臉識(shí)別教程》
 介紹:用樹莓派和相機(jī)模塊進(jìn)行人臉識(shí)別
??? 《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng) 》
 介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng)
??? 《經(jīng)典論文Leo Breiman:Statistical Modeling: The Two Cultures 》
 介紹:Francis Bach合作的有關(guān)稀疏建模的新綜述(書):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理論,以及在圖像和視覺上的應(yīng)用,而且第一部分關(guān)于Why does the l1-norm induce sparsity的解釋也很不錯(cuò)。
??? 《Reproducing Kernel Hilbert Space》
 介紹:RKHS是機(jī)器學(xué)習(xí)中重要的概念,其在large margin分類器上的應(yīng)用也是廣為熟知的。如果沒有較好的數(shù)學(xué)基礎(chǔ),直接理解RKHS可能會(huì)不易。本文從基本運(yùn)算空間講到Banach和Hilbert空間,深入淺出,一共才12頁(yè)。
??? 《Hacker's guide to Neural Networks》
 介紹:許多同學(xué)對(duì)于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動(dòng)起手來(lái)卻不知道如何下手寫代碼。斯坦福深度學(xué)習(xí)博士Andrej Karpathy寫了一篇實(shí)戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用Javascript寫神經(jīng)網(wǎng)絡(luò)和SVM.
??? 《【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總》
 介紹:【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總
??? 《機(jī)器學(xué)習(xí)算法之旅》
 介紹:本文會(huì)過一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。
??? 《Reproducible Research in Computational Science》
 介紹:這個(gè)里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號(hào)處理、計(jì)算機(jī)視覺、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文。科研寫論文的好資源
??? 《NYU 2014年的深度學(xué)習(xí)課程資料》
 介紹:NYU 2014年的深度學(xué)習(xí)課程資料,有視頻
??? 《計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總》
 介紹:計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總
??? 《Machine Learning Open Source Software》
 介紹:機(jī)器學(xué)習(xí)開源軟件
??? 《LIBSVM》
 介紹:A Library for Support Vector Machines
??? 《Support Vector Machines》
 介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一
??? 《100 Best GitHub: Deep Learning》
 介紹:github上面100個(gè)非常棒的項(xiàng)目
??? 《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉(cāng)庫(kù)》
 介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著306個(gè)數(shù)據(jù)集。查詢數(shù)據(jù)集
??? 《Andrej Karpathy個(gè)人主頁(yè)》
 介紹:Andrej Karpathy 是斯坦福大學(xué)Li Fei-Fei的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語(yǔ)義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個(gè)都很扎實(shí),在每一個(gè)問題上都做到了state-of-art.
??? 《Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示》
 介紹:Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示,論文在這里
??? 《CIKM數(shù)據(jù)挖掘競(jìng)賽奪冠算法-陳運(yùn)文》
 介紹:CIKM Cup(或者稱為CIKM Competition)是ACM CIKM舉辦的國(guó)際數(shù)據(jù)挖掘競(jìng)賽的名稱。
??? 《Geoffrey E. Hinton》
 介紹:杰弗里·埃弗里斯特·辛頓 FRS是一位英國(guó)出生的計(jì)算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對(duì)比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動(dòng)者.
??? 《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》
 介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在CIKM2014 上關(guān)于《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》教學(xué)講座的幻燈片
??? 《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價(jià)格預(yù)測(cè)》
 介紹: 本文基于<支持向量機(jī)的高頻限價(jià)訂單的動(dòng)態(tài)建模>采用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價(jià)格運(yùn)動(dòng)預(yù)測(cè)模型。(股票有風(fēng)險(xiǎn),投資謹(jǐn)慎)GitHub源代碼托管地址.
??? 《關(guān)于機(jī)器學(xué)習(xí)的若干理論問題》
 介紹:徐宗本 院士將于熱愛機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個(gè)理論性問題,并給出一些有意義的結(jié)論。最后通過一些實(shí)例來(lái)說(shuō)明這些理論問題的物理意義和實(shí)際應(yīng)用價(jià)值。
??? 《深度學(xué)習(xí)在自然語(yǔ)言處理的應(yīng)用》
 介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書,主要是介紹應(yīng)用層的東西
??? 《Undergraduate machine learning at UBC》
 介紹:機(jī)器學(xué)習(xí)課程
??? 《人臉識(shí)別必讀的N篇文章》
 介紹:人臉識(shí)別必讀文章推薦
??? 《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》
 介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)
??? 《人臉識(shí)別必讀的N篇文章》
 介紹:人臉識(shí)別必讀文章推薦
??? 《第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT》
 介紹:第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT
??? 《統(tǒng)計(jì)機(jī)器學(xué)習(xí)》
 介紹:統(tǒng)計(jì)學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計(jì)模型并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析的一門科學(xué),統(tǒng)計(jì)學(xué)習(xí)也成為統(tǒng)計(jì)機(jī)器學(xué)習(xí)。課程來(lái)自上海交通大學(xué)
??? 《機(jī)器學(xué)習(xí)導(dǎo)論》
 介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對(duì)計(jì)算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗(yàn)來(lái)解決給定的問題.
??? 《CIKM 2014主題報(bào)告的幻燈片》
 介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報(bào)告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報(bào)告的幻燈片
??? 《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項(xiàng)目》
 介紹:部分中文列表
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--基于SMO的SVM分類器》
 介紹:此外作者還有一篇元算法、AdaBoost python實(shí)現(xiàn)文章
??? 《Numerical Optimization: Understanding L-BFGS》
 介紹:加州伯克利大學(xué)博士Aria Haghighi寫了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到BFGS以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。
??? 《簡(jiǎn)明深度學(xué)習(xí)方法概述(一)》
 介紹:還有續(xù)集簡(jiǎn)明深度學(xué)習(xí)方法概述(二)
??? 《R language for programmers》
 介紹:R語(yǔ)言程序員私人定制版
??? 《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
 介紹:谷歌地圖解密
??? 《空間數(shù)據(jù)挖掘常用方法》
 介紹:空間數(shù)據(jù)挖掘常用方法
??? 《Use Google's Word2Vec for movie reviews》
 介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在實(shí)際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過gensim不要忘升級(jí)
??? 《PyNLPIR》
 介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語(yǔ)分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字符和偏旁,中文標(biāo)點(diǎn),拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
??? 《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
 介紹:這文章說(shuō)把最近模型識(shí)別上的突破應(yīng)用到圍棋軟件上,打16萬(wàn)張職業(yè)棋譜訓(xùn)練模型識(shí)別功能。想法不錯(cuò)。訓(xùn)練后目前能做到不用計(jì)算,只看棋盤就給出下一步,大約10級(jí)棋力。但這篇文章太過樂觀,說(shuō)什么人類的最后一塊堡壘馬上就要跨掉了。話說(shuō)得太早。不過,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬(wàn)精油墨綠
??? 《NIPS審稿實(shí)驗(yàn)》
 介紹:UT Austin教授Eric Price關(guān)于今年NIPS審稿實(shí)驗(yàn)的詳細(xì)分析,他表示,根據(jù)這次實(shí)驗(yàn)的結(jié)果,如果今年NIPS重新審稿的話,會(huì)有一半的論文被拒。
??? 《2014年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》
 介紹:KDNuggets分別總結(jié)了2014年14個(gè)閱讀最多以及分享最多的文章。我們從中可以看到多個(gè)主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和Python以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語(yǔ)言
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--線性回歸(Linear Regression)算法》
 介紹:Python實(shí)現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看
??? 《2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF》
 介紹:2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF下載
??? 《使用RNN和Paragraph Vector做情感分析》
 介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不錯(cuò),[項(xiàng)目代碼](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。這意味著Paragraph Vector終于揭開面紗了嘛。
??? 《NLPIR/ICTCLAS2015分詞系統(tǒng)大會(huì)上的技術(shù)演講 》
 介紹:NLPIR/ICTCLAS2015分詞系統(tǒng)發(fā)布與用戶交流大會(huì)上的演講,請(qǐng)更多朋友檢閱新版分詞吧。 我們實(shí)驗(yàn)室同學(xué)的演講包括:孫夢(mèng)姝-基于評(píng)論觀點(diǎn)挖掘的商品搜索技術(shù)研究 李然-主題模型
??? 《Machine Learning is Fun!》
 介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
??? 《CNN的反向求導(dǎo)及練習(xí)》
 介紹:介紹CNN參數(shù)在使用bp算法時(shí)該怎么訓(xùn)練,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個(gè)資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺,數(shù)學(xué)等
??? 《正則表達(dá)式優(yōu)化成Trie樹 》
 介紹:如果要在一篇文章中匹配十萬(wàn)個(gè)關(guān)鍵詞怎么辦?Aho-Corasick 算法利用添加了返回邊的Trie樹,能夠在線性時(shí)間內(nèi)完成匹配。 但如果匹配十萬(wàn)個(gè)正則表達(dá)式呢 ? 這時(shí)候可以用到把多個(gè)正則優(yōu)化成Trie樹的方法,如日本人寫的Regexp::Trie
??? 《Deep learning Reading List》
 介紹:深度學(xué)習(xí)閱讀清單
??? 《Caffe》
 介紹:Caffe是一個(gè)開源的深度學(xué)習(xí)框架,作者目前在google工作,作者主頁(yè)Yangqing Jia (賈揚(yáng)清)
??? 《GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn) 》
 介紹:2014 ImageNet冠軍GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn)模型,GoogleNet論文.
??? 《LambdaNet,Haskell實(shí)現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫(kù) 》
 介紹:LambdaNetLambdaNet是由Haskell實(shí)現(xiàn)的一個(gè)開源的人工神經(jīng)網(wǎng)絡(luò)庫(kù),它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫(kù)還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來(lái)操作現(xiàn)實(shí)世界數(shù)據(jù)。
??? 《百度余凱&張潼機(jī)器學(xué)習(xí)視頻》
 介紹:如果你從事互聯(lián)網(wǎng)搜索,在線廣告,用戶行為分析,圖像識(shí)別,自然語(yǔ)言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測(cè),那么這門核心課程你必須深入了解。
??? 《楊強(qiáng)在TEDxNanjing談智能的起源》
 介紹:"人工智能研究分許多流派。其中之一以IBM為代表,認(rèn)為只要有高性能計(jì)算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智能來(lái)自動(dòng)物本能;還有個(gè)很強(qiáng)的流派認(rèn)為只要找來(lái)專家,把他們的思維用邏輯一條條寫下,放到計(jì)算機(jī)里就行……" 楊強(qiáng)在TEDxNanjing談智能的起源
??? 《深度RNN/LSTM用于結(jié)構(gòu)化學(xué)習(xí) 0)序列標(biāo)注Connectionist Temporal ClassificationICML06》
 介紹:1)機(jī)器翻譯Sequence to Sequence NIPS14 2)成分句法GRAMMAR AS FOREIGN LANGUAGE
??? 《Deep Learning實(shí)戰(zhàn)之word2vec》
 介紹:網(wǎng)易有道的三位工程師寫的word2vec的解析文檔,從基本的詞向量/統(tǒng)計(jì)語(yǔ)言模型->NNLM->Log-Linear/Log-Bilinear->層次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各種tricks,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于word2vec資料的大合集,對(duì)word2vec感興趣的朋友可以看看
??? 《Machine learning open source software》
 介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語(yǔ)言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
??? 《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》
 介紹:作者是計(jì)算機(jī)研二(寫文章的時(shí)候,現(xiàn)在是2015年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語(yǔ)言處理.這是一點(diǎn)他的經(jīng)驗(yàn)之談.對(duì)于入門的朋友或許會(huì)有幫助
??? 《A Tour of Machine Learning Algorithms》
 介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章,非常好
??? 《2014年的《機(jī)器學(xué)習(xí)日?qǐng)?bào)》大合集》
 介紹:機(jī)器學(xué)習(xí)日?qǐng)?bào)里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來(lái)自機(jī)器學(xué)習(xí)日?qǐng)?bào).
??? 《 Image classification with deep learning常用模型》
 介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章
??? 《自動(dòng)語(yǔ)音識(shí)別:深度學(xué)習(xí)方法》
 介紹:作者與Bengio的兄弟Samy 09年合編《自動(dòng)語(yǔ)音識(shí)別:核方法》 3)李開復(fù)1989年《自動(dòng)語(yǔ)音識(shí)別》專著,其博導(dǎo)、94年圖靈獎(jiǎng)得主Raj Reddy作序
??? 《NLP中的中文分詞技術(shù)》
 介紹: 作者是360電商技術(shù)組成員,這是一篇NLP在中文分詞中的應(yīng)用
??? 《Using convolutional neural nets to detect facial keypoints tutorial》
 介紹: 使用deep learning的人臉關(guān)鍵點(diǎn)檢測(cè),此外還有一篇AWS部署教程
??? 《書籍推薦:Advanced Structured Prediction》
 介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG ,匯集了結(jié)構(gòu)化預(yù)測(cè)領(lǐng)域諸多牛文,涉及CV、NLP等領(lǐng)域,值得一讀。網(wǎng)上公開的幾章草稿:一,二,三,四,五
??? 《An Introduction to Matrix Concentration Inequalities》
 介紹: Tropp把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語(yǔ)言寫的矩陣概率不等式用初等的方法寫出來(lái),是非常好的手冊(cè),領(lǐng)域內(nèi)的paper各種證明都在用里面的結(jié)果。雖說(shuō)是初等的,但還是非常的難
??? 《The free big data sources you should know》
 介紹: 不容錯(cuò)過的免費(fèi)大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽說(shuō),內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧,具體包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等
??? 《A Brief Overview of Deep Learning》
 介紹: 谷歌科學(xué)家、Hinton親傳弟子Ilya Sutskever的深度學(xué)習(xí)綜述及實(shí)際建議
??? 《A Deep Dive into Recurrent Neural Nets》
 介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了RNN的概念、原理、訓(xùn)練及優(yōu)化等各個(gè)方面內(nèi)容,強(qiáng)烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦
??? 《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
 介紹:里面融合了很多的資源,例如競(jìng)賽,在線課程,demo,數(shù)據(jù)整合等。有分類
??? 《Statistical foundations of machine learning》
 介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計(jì)基礎(chǔ)》在線版,該手冊(cè)希望在理論與實(shí)踐之間找到平衡點(diǎn),各主要內(nèi)容都伴有實(shí)際例子及數(shù)據(jù),書中的例子程序都是用R語(yǔ)言編寫的。
??? 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
 介紹:IVAN VASILEV寫的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀
??? 《Research priorities for robust and beneficial artificial intelligence》
 介紹:魯棒及有益的人工智能優(yōu)先研究計(jì)劃:一封公開信,目前已經(jīng)有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人簽署The Future of Life Institute (FLI).這封信的背景是最近霍金和Elon Musk提醒人們注意AI的潛在威脅。公開信的內(nèi)容是AI科學(xué)家們站在造福社會(huì)的角度,展望人工智能的未來(lái)發(fā)展方向,提出開發(fā)AI系統(tǒng)的Verification,Validity, Security, Control四點(diǎn)要求,以及需要注意的社會(huì)問題。畢竟當(dāng)前AI在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實(shí)還有一部美劇《疑犯追蹤》,介紹了AI的演進(jìn)從一開始的自我學(xué)習(xí),過濾,圖像識(shí)別,語(yǔ)音識(shí)別等判斷危險(xiǎn),到第四季的時(shí)候出現(xiàn)了機(jī)器通過學(xué)習(xí)成長(zhǎng)之后想控制世界的狀態(tài)。說(shuō)到這里推薦收看。
??? 《metacademy》
 介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識(shí)結(jié)構(gòu),路線圖,用時(shí)長(zhǎng)短等。號(hào)稱是”機(jī)器學(xué)習(xí)“搜索引擎
??? 《FAIR open sources deep-learning modules for Torch》
 介紹:Facebook人工智能研究院(FAIR)開源了一系列軟件庫(kù),以幫助開發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開放的軟件庫(kù)在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
??? 《淺析人臉檢測(cè)之Haar分類器方法》
 介紹:本文雖然是寫于2012年,但是這篇文章完全是作者的經(jīng)驗(yàn)之作。
??? 《如何成為一位數(shù)據(jù)科學(xué)家》
 介紹:本文是對(duì)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》作者Peter Harrington做的一個(gè)訪談。包含了書中部分的疑問解答和一點(diǎn)個(gè)人學(xué)習(xí)建議
??? 《Deep learning from the bottom up》
 介紹:非常好的深度學(xué)習(xí)概述,對(duì)幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論
??? 《Hands-On Data Science with R Text Mining》
 介紹:主要是講述了利用R語(yǔ)言進(jìn)行數(shù)據(jù)挖掘
??? 《Understanding Convolutions》
 介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒
??? 《Introduction to Deep Learning Algorithms》
 介紹:Deep Learning算法介紹,里面介紹了06年3篇讓deep learning崛起的論文
??? 《Learning Deep Architectures for AI》
 介紹:一本學(xué)習(xí)人工智能的書籍,作者是Yoshua Bengio,相關(guān)國(guó)內(nèi)報(bào)道
??? 《Geoffrey E. Hinton個(gè)人主頁(yè)》
 介紹:Geoffrey Hinton是Deep Learning的大牛,他的主頁(yè)放了一些介紹性文章和課件值得學(xué)習(xí)
??? 《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
 介紹:概率論:數(shù)理邏輯書籍
??? 《H2O》
 介紹:一個(gè)用來(lái)快速的統(tǒng)計(jì),機(jī)器學(xué)習(xí)并且對(duì)于數(shù)據(jù)量大的數(shù)學(xué)庫(kù)
??? 《ICLR 2015會(huì)議的arXiv稿件合集》
 介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動(dòng)向。
??? 《Introduction to Information Retrieval》
 介紹:此書在信息檢索領(lǐng)域家喻戶曉, 除提供該書的免費(fèi)電子版外,還提供一個(gè)IR資源列表 ,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實(shí)現(xiàn)等方面相關(guān)的圖書、研究中心、相關(guān)課程、子領(lǐng)域、會(huì)議、期刊等等,堪稱全集,值得收藏
參考文獻(xiàn):http://ask.julyedu.com/article/58
* 《Machine learning in 10 pictures》
介紹:Deniz Yuret用10張漂亮的圖來(lái)解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰
??? 《雅虎研究院的數(shù)據(jù)集匯總》
 介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語(yǔ)言類數(shù)據(jù),圖與社交類數(shù)據(jù),評(píng)分與分類數(shù)據(jù),計(jì)算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競(jìng)賽數(shù)據(jù),以及系統(tǒng)類的數(shù)據(jù)。
??? 《An Introduction to Statistical Learning with Applications in R》
 介紹:這是一本斯坦福統(tǒng)計(jì)學(xué)著名教授Trevor Hastie和Robert Tibshirani的新書,并且在2014年一月已經(jīng)開課:https://class.stanford.edu/cou ... about
??? Best Machine Learning Resources for Getting Started
 介紹:機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總是專為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。
??? My deep learning reading list
 介紹:主要是順著Bengio的PAMI review的文章找出來(lái)的。包括幾本綜述文章,將近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。
??? Cross-Language Information Retrieval
 介紹:這是一本書籍,主要介紹的是跨語(yǔ)言信息檢索方面的知識(shí)。理論很多
??? 探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探
 介紹:本文共有三個(gè)系列,作者是來(lái)自IBM的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實(shí)現(xiàn)這些算法。探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類
??? 《Advice for students of machine learning》
 介紹:康奈爾大學(xué)信息科學(xué)系助理教授David Mimno寫的《對(duì)機(jī)器學(xué)習(xí)初學(xué)者的一點(diǎn)建議》, 寫的挺實(shí)際,強(qiáng)調(diào)實(shí)踐與理論結(jié)合,最后還引用了馮 ? 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
??? 分布式并行處理的數(shù)據(jù)
 介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。著重介紹了各種神級(jí)網(wǎng)絡(luò)算法的分布式實(shí)現(xiàn),做Distributed Deep Learning 的童鞋可以參考下
??? 《“機(jī)器學(xué)習(xí)”是什么?》
 介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt是微軟研究院杰出科學(xué)家,17年來(lái)他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來(lái)機(jī)器學(xué)習(xí)變得炙手可熱,Platt和同事們遂決定開設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來(lái)看Platt的這篇博文
??? 《2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)ICML 2014 論文》
 介紹:2014年國(guó)際機(jī)器學(xué)習(xí)大會(huì)(ICML)已經(jīng)于6月21-26日在國(guó)家會(huì)議中心隆重舉辦。本次大會(huì)由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這個(gè)有著30多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會(huì)首次來(lái)到中國(guó),已成功吸引海內(nèi)外1200多位學(xué)者的報(bào)名參與。干貨很多,值得深入學(xué)習(xí)下
??? 《Machine Learning for Industry: A Case Study》
 介紹:這篇文章主要是以Learning to Rank為例說(shuō)明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet對(duì)NDCG之類不敏感,加入NDCG因素后變成了LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò)改為應(yīng)用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表論文為:
 From RankNet to LambdaRank to LambdaMART: An Overview
 此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning
??? 100 Best GitHub: Deep Learning
 介紹:100 Best GitHub: Deep Learning
??? 《UFLDL-斯坦福大學(xué)Andrew Ng教授“Deep Learning”教程》
 介紹:本教程將闡述無(wú)監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點(diǎn)。通過學(xué)習(xí),你也將實(shí)現(xiàn)多個(gè)功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?#xff0c;并學(xué)習(xí)如何應(yīng)用/適應(yīng)這些想法到新問題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(shí)(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第II,III,IV章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在github上面已經(jīng)有python版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介紹:這份文檔來(lái)自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過有些地方會(huì)讓人眼前一亮,毛塞頓開。
??? Understanding Convolutions
 介紹:這是一篇介紹圖像卷積運(yùn)算的文章,講的已經(jīng)算比較詳細(xì)的了
??? 《Machine Learning Summer School》
 介紹:每天請(qǐng)一個(gè)大牛來(lái)講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計(jì)算以及人腦研究。https://www.youtube.com/user/smolix (需翻墻)
??? 《Awesome Machine Learning》
 介紹:一個(gè)超級(jí)完整的機(jī)器學(xué)習(xí)開源庫(kù)總結(jié),如果你認(rèn)為這個(gè)碉堡了,那后面這個(gè)列表會(huì)更讓你驚訝:【Awesome Awesomeness】,國(guó)內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費(fèi)電子書
??? 斯坦福《自然語(yǔ)言處理》課程視頻
 介紹:ACL候任主席、斯坦福大學(xué)計(jì)算機(jī)系Chris Manning教授的《自然語(yǔ)言處理》課程所有視頻已經(jīng)可以在斯坦福公開課網(wǎng)站上觀看了(如Chrome不行,可用IE觀看) 作業(yè)與測(cè)驗(yàn)也可以下載。
??? 《Deep Learning and Shallow Learning》
 介紹:對(duì)比 Deep Learning 和 Shallow Learning 的好文,來(lái)著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。
??? 《Recommending music on Spotify with deep learning》
 介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂推薦。
??? 《Neural Networks and Deep Learning》
 介紹:神經(jīng)網(wǎng)絡(luò)的免費(fèi)在線書,已經(jīng)寫了三章了,還有對(duì)應(yīng)的開源代碼:https://github.com/mnielsen/ne ... rning 愛好者的福音。
??? 《Java Machine Learning》
 介紹:Java機(jī)器學(xué)習(xí)相關(guān)平臺(tái)和開源的機(jī)器學(xué)習(xí)庫(kù),按照大數(shù)據(jù)、NLP、計(jì)算機(jī)視覺和Deep Learning分類進(jìn)行了整理。看起來(lái)挺全的,Java愛好者值得收藏。
??? 《Machine Learning Theory: An Introductory Primer》
 介紹:機(jī)器學(xué)習(xí)最基本的入門文章,適合零基礎(chǔ)者
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
 介紹:機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來(lái)的。這里,我們從兩個(gè)方面來(lái)給大家介紹,第一個(gè)方面是學(xué)習(xí)的方式,第二個(gè)方面是算法的類似性。
??? 《機(jī)器學(xué)習(xí)經(jīng)典論文/survey合集》
 介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒錯(cuò)。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。
??? 《機(jī)器學(xué)習(xí)視頻庫(kù)》
 介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語(yǔ)底子。
??? 《機(jī)器學(xué)習(xí)經(jīng)典書籍》
 介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書籍,可做為入門參考書單。
??? 《16 Free eBooks On Machine Learning》
 介紹:16本機(jī)器學(xué)習(xí)的電子書,可以下載下來(lái)在pad,手機(jī)上面任意時(shí)刻去閱讀。不多我建議你看完一本再下載一本。
??? 《A Large set of Machine Learning Resources for Beginners to Mavens》
 介紹:標(biāo)題很大,從新手到專家。不過看完上面所有資料。肯定是專家了
??? 《機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總》
 介紹:入門的書真的很多,而且我已經(jīng)幫你找齊了。
??? 《Sibyl》
 介紹:Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如 YouTube 的視頻推薦。
??? 《Deep Learning》
 介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著
??? 《Neural Network & Text Mining》
 介紹:關(guān)于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結(jié)
??? 《前景目標(biāo)檢測(cè)1(總結(jié))》
 介紹:計(jì)算機(jī)視覺入門之前景目標(biāo)檢測(cè)1(總結(jié))
??? 《行人檢測(cè)》
 介紹:計(jì)算機(jī)視覺入門之行人檢測(cè)
??? 《Deep Learning – important resources for learning and understanding》
 介紹:Important resources for learning and understanding . Is awesome
??? 《Machine Learning Theory: An Introductory Primer》
 介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門文章。值得一讀
??? 《Neural Networks and Deep Learning》
 介紹:在線Neural Networks and Deep Learning電子書
??? 《Python 網(wǎng)頁(yè)爬蟲 & 文本處理 & 科學(xué)計(jì)算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》
 介紹:python的17個(gè)關(guān)于機(jī)器學(xué)習(xí)的工具
??? 《神奇的伽瑪函數(shù)(上)》
 介紹:下集在這里神奇的伽瑪函數(shù)(下)
??? 《分布式機(jī)器學(xué)習(xí)的故事》
 介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在google任研究。這篇文章王益博士7年來(lái)從谷歌到騰訊對(duì)于分布機(jī)器學(xué)習(xí)的所見所聞。值得細(xì)讀
??? 《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》
 介紹:把機(jī)器學(xué)習(xí)提升的級(jí)別分為0~4級(jí),每級(jí)需要學(xué)習(xí)的教材和掌握的知識(shí)。這樣,給機(jī)器學(xué)習(xí)者提供一個(gè)上進(jìn)的路線圖,以免走彎路。另外,整個(gè)網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。
??? 《Machine Learning Surveys》
 介紹:機(jī)器學(xué)習(xí)各個(gè)方向綜述的網(wǎng)站
??? 《Deep Learning Reading list》
 介紹:深度學(xué)習(xí)閱資源列表
??? 《Deep Learning: Methods and Applications》
 介紹:這是一本來(lái)自微的研究員 li Peng和Dong Yu所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書
??? 《Machine Learning Summer School 2014》
 介紹:2014年七月CMU舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束 有近50小時(shí)的視頻、十多個(gè)PDF版幻燈片,覆蓋 深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性 等熱點(diǎn)話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有CMU李沐 .(1080P高清喲)
??? 《Sibyl: 來(lái)自Google的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》
 介紹:在今年的IEEE/IFIP可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國(guó)際會(huì)議上,Google軟件工程師Tushar Chandra做了一個(gè)關(guān)于Sibyl系統(tǒng)的主題演講。 Sibyl是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來(lái)解決預(yù)測(cè)方面的問題,比如YouTube的視頻推薦。詳情請(qǐng)閱讀google sibyl
??? 《Building a deeper understanding of images》
 介紹:谷歌研究院的Christian Szegedy在谷歌研究院的博客上簡(jiǎn)要地介紹了他們今年參加ImageNet取得好成績(jī)的GoogLeNet系統(tǒng).是關(guān)于圖像處理的。
??? 《Bayesian network 與python概率編程實(shí)戰(zhàn)入門》
 介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語(yǔ)言與貝葉斯方法實(shí)踐
??? 《AMA: Michael I Jordan》
 介紹:網(wǎng)友問伯克利機(jī)器學(xué)習(xí)大牛、美國(guó)雙料院士Michael I. Jordan:"如果你有10億美金,你怎么花?Jordan: "我會(huì)用這10億美金建造一個(gè)NASA級(jí)別的自然語(yǔ)言處理研究項(xiàng)目。"
??? 《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理)》
 介紹:常見面試之機(jī)器學(xué)習(xí)算法思想簡(jiǎn)單梳理,此外作者還有一些其他的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘文章和深度學(xué)習(xí)文章,不僅是理論還有源碼。
??? 《文本與數(shù)據(jù)挖掘視頻匯總》
 介紹:Videolectures上最受歡迎的25個(gè)文本與數(shù)據(jù)挖掘視頻匯總
??? 《怎么選擇深度學(xué)習(xí)的GPUs》
 介紹:在Kaggle上經(jīng)常取得不錯(cuò)成績(jī)的Tim Dettmers介紹了他自己是怎么選擇深度學(xué)習(xí)的GPUs, 以及個(gè)人如何構(gòu)建深度學(xué)習(xí)的GPU集群: http://t.cn/RhpuD1G
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:深度模型》
 介紹:對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan
??? 《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》
 介紹:還有2,3部分。http://blog.sina.com.cn/s/blog ... .html
??? 《Deep Learning 教程翻譯》
 介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國(guó)內(nèi)的機(jī)器學(xué)習(xí)愛好者很熱心的把這個(gè)教程翻譯成了中文。如果你英語(yǔ)不好,可以看看這個(gè)
??? 《Deep Learning 101》
 介紹:因?yàn)榻鼉赡陙?lái),深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實(shí)很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!
??? 《UFLDL Tutorial》
 介紹:這是斯坦福大學(xué)做的一免費(fèi)課程(很勉強(qiáng)),這個(gè)可以給你在深度學(xué)習(xí)的路上給你一個(gè)學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實(shí)際環(huán)境中。中文版
??? 《Toronto Deep Learning Demos》
 介紹:這是多倫多大學(xué)做的一個(gè)深度學(xué)習(xí)用來(lái)識(shí)別圖片標(biāo)簽/圖轉(zhuǎn)文字的demo。是一個(gè)實(shí)際應(yīng)用案例。有源碼
??? 《Deep learning from the bottom up》
 介紹:機(jī)器學(xué)習(xí)模型,閱讀這個(gè)內(nèi)容需要有一定的基礎(chǔ)。
??? 《R工具包的分類匯總》
 介紹: (CRAN Task Views, 34種常見任務(wù),每個(gè)任務(wù)又各自分類列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語(yǔ)言處理,時(shí)間序列分析,空間信息分析,多重變量分析,計(jì)量經(jīng)濟(jì)學(xué),心理統(tǒng)計(jì)學(xué),社會(huì)學(xué)統(tǒng)計(jì),化學(xué)計(jì)量學(xué),環(huán)境科學(xué),藥物代謝動(dòng)力學(xué) 等
??? 《機(jī)器學(xué)習(xí)常見算法分類匯總》
 介紹: 機(jī)器學(xué)習(xí)無(wú)疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.
??? 《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
 介紹: 很多干貨,而且作者還總結(jié)了好幾個(gè)系列。另外還作者還了一個(gè)文章導(dǎo)航.非常的感謝作者總結(jié)。
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)
DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)
??? 《Tutorials Session A - Deep Learning for Computer Vision》
 介紹:傳送理由:Rob Fergus的用深度學(xué)習(xí)做計(jì)算機(jī)是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載 他是紐約大學(xué)教授,目前也在Facebook工作,他2014年的8篇論文
??? 《FudanNLP》
 介紹:FudanNLP,這是一個(gè)復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院開發(fā)的開源中文自然語(yǔ)言處理(NLP)工具包
 Fudan NLP里包含中文分詞、關(guān)鍵詞抽取、命名實(shí)體識(shí)別、詞性標(biāo)注、時(shí)間詞抽取、語(yǔ)法分析等功能,對(duì)搜索引擎 文本分析等極為有價(jià)值。
??? 《Open Sourcing ml-ease》
 介紹:LinkedIn 開源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點(diǎn)是 logistic regression 算法
??? 《機(jī)器學(xué)習(xí)周刊》
 介紹:對(duì)于英語(yǔ)不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個(gè)大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國(guó)內(nèi)愛好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識(shí)別、人工智能、機(jī)器人等等。謝謝作者
??? 《線性代數(shù)》
 介紹:《線性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實(shí)《線代》這門課講得淺顯易懂特別不容易,如果一上來(lái)就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個(gè)人推薦的最佳《線性代數(shù)》課程是麻省理工Gilbert Strang教授的課程。 課程主頁(yè)
??? 《Big-data》
 介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲(chǔ)、機(jī)器學(xué)習(xí)等。很贊的資源匯總。
??? 《machine learning for smart dummies》
 介紹:雅虎邀請(qǐng)了一名來(lái)自本古里安大學(xué)的訪問學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為7期,詳細(xì)講解了有關(guān)SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識(shí)。
??? 《Entanglement-Based Quantum Machine Learning》
 介紹:應(yīng)對(duì)大數(shù)據(jù)時(shí)代,量子機(jī)器學(xué)習(xí)的第一個(gè)實(shí)驗(yàn) paper 下載
??? 《How a Math Genius Hacked OkCupid to Find True Love》
 介紹:Wired雜志報(bào)道了UCLA數(shù)學(xué)博士Chris McKinlay (圖1)通過大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對(duì)算法找到真愛的故事,通過Python腳本控制著12個(gè)賬號(hào),下載了婚戀網(wǎng)站2萬(wàn)女用戶的600萬(wàn)問題答案,對(duì)他們進(jìn)行了統(tǒng)計(jì)抽樣及聚類分析(圖2,3),最后終于收獲了真愛。科技改變命運(yùn)!
??? 《Underactuated Robotics》
 介紹:MIT的Underactuated Robotics于 2014年10月1日開課,該課屬于MIT研究生級(jí)別的課程,對(duì)機(jī)器人和非線性動(dòng)力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門課程!
??? 《mllib實(shí)踐經(jīng)驗(yàn)(1)》
 介紹:mllib實(shí)踐經(jīng)驗(yàn)分享
??? 《Google Turns To Deep Learning Classification To Fight Web Spam》
 介紹:Google用Deep Learning做的antispam(反垃圾郵件)
??? 《NLP常用信息資源》
 介紹:NLP常用信息資源* 《NLP常用信息資源》
??? 《機(jī)器學(xué)習(xí)速查表》
 介紹:機(jī)器學(xué)習(xí)速查表
??? 《Best Papers vs. Top Cited Papers in Computer Science》
 介紹:從1996年開始在計(jì)算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文
??? 《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》
 介紹:把今年的一個(gè)ACM Trans. on Graphics (TOG)論文中的代碼整理為一個(gè)開源的算法框架,共享出來(lái)了。歡迎大家使用。可以實(shí)時(shí)的采集3D數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會(huì)后續(xù)公開。
??? 《Hacker's guide to Neural Networks》
 介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開源項(xiàng)目convnetjs作者karpathy告訴你,最佳技巧是,當(dāng)你開始寫代碼,一切將變得清晰。他剛發(fā)布了一本圖書,不斷在線更新
??? 《Building a Production Machine Learning Infrastructure》
 介紹:前Google廣告系統(tǒng)工程師Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實(shí)話
??? 《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
 介紹:使用Neo4j 做電影評(píng)論的情感分析。
??? 《DeepLearning.University – An Annotated Deep Learning Bibliography》
 介紹:不僅是資料,而且還對(duì)有些資料做了注釋。
??? 《A primer on deeping learning》
 介紹:深度學(xué)習(xí)入門的初級(jí)讀本
??? 《Machine learning is teaching us the secret to teaching 》
 介紹:機(jī)器學(xué)習(xí)教會(huì)了我們什么?
??? 《scikit-learn:用于機(jī)器學(xué)習(xí)的Python模塊》
 介紹:scikit-learn是在SciPy基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的Python模塊。
??? 《對(duì)話機(jī)器學(xué)習(xí)大神Michael Jordan:解析領(lǐng)域中各類模型》
 介紹:喬丹教授(Michael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對(duì)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問的問題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類模型,喬丹教授對(duì)此一一做了解釋和展望。
??? 《A*搜索算法的可視化短教程》
 介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點(diǎn)的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點(diǎn)到頂點(diǎn)n的實(shí)際代價(jià),h(n)是頂點(diǎn)n到目標(biāo)頂點(diǎn)的估算代價(jià)。合集
??? 《基于云的自然語(yǔ)言處理開源項(xiàng)目FudanNLP》
 介紹:本項(xiàng)目利用了Microsoft Azure,可以在幾分種內(nèi)完成NLP on Azure Website的部署,立即開始對(duì)FNLP各種特性的試用,或者以REST API的形式調(diào)用FNLP的語(yǔ)言分析功能
??? 《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》
 介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計(jì)算機(jī)軟件博士生導(dǎo)師。計(jì)算機(jī)科學(xué)研究所副所長(zhǎng).內(nèi)部課程
??? 《機(jī)器學(xué)習(xí)入門資源不完全匯總》》
 介紹:好東西的干貨真的很多
??? 《收集從2014年開始深度學(xué)習(xí)文獻(xiàn)》
 介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計(jì)算等,Amund Tveit等維護(hù)了一個(gè)DeepLearning.University小項(xiàng)目:收集從2014年開始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點(diǎn),github
??? 《EMNLP上兩篇關(guān)于股票趨勢(shì)的應(yīng)用論文 》
 介紹:EMNLP上兩篇關(guān)于stock trend 用到了deep model組織特征; Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。
??? 《Bengio組(蒙特利爾大學(xué)LISA組)深度學(xué)習(xí)教程 》
 介紹:作者是深度學(xué)習(xí)一線大牛Bengio組寫的教程,算法深入顯出,還有實(shí)現(xiàn)代碼,一步步展開。
??? 《學(xué)習(xí)算法的Neural Turing Machine 》
 介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí)function,不過谷歌目前有開始學(xué)習(xí)算法的趨勢(shì)。谷歌另外的這篇學(xué)習(xí)Python程序的Learning to Execute也有相似之處
??? 《Learning to Rank for Information Retrieval and Natural Language Processing》
 介紹:作者是華為技術(shù)有限公司,諾亞方舟實(shí)驗(yàn)室,首席科學(xué)家的李航博士寫的關(guān)于信息檢索與自然語(yǔ)言處理的文章
??? 《Rumor has it: Identifying Misinformation in Microblogs》
 介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個(gè)。一個(gè)是識(shí)別垃圾與虛假信息的paper.還有一個(gè)是網(wǎng)絡(luò)輿情及其分析技術(shù)
??? 《R機(jī)器學(xué)習(xí)實(shí)踐》
 介紹:該課程是網(wǎng)易公開課的收費(fèi)課程,不貴,超級(jí)便宜。主要適合于對(duì)利用R語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。
??? 《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化》
 介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer實(shí)現(xiàn)基于Hadoop的擴(kuò)展,第三代如Spark和Storm實(shí)現(xiàn)了實(shí)時(shí)和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP
??? 《圖像處理,分析與機(jī)器視覺》
 介紹:講計(jì)算機(jī)視覺的四部奇書(應(yīng)該叫經(jīng)典吧)之一,另外三本是Hartley的《多圖幾何》、Gonzalez的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》
??? 《LinkedIn最新的推薦系統(tǒng)文章Browsemaps》
 介紹:里面基本沒涉及到具體算法,但作者介紹了CF在LinkedIn的很多應(yīng)用,以及他們?cè)谧鐾扑]過程中獲得的一些經(jīng)驗(yàn)。最后一條經(jīng)驗(yàn)是應(yīng)該監(jiān)控log數(shù)據(jù)的質(zhì)量,因?yàn)橥扑]的質(zhì)量很依賴數(shù)據(jù)的質(zhì)量!
??? 《初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料》
 介紹:初學(xué)者如何查閱自然語(yǔ)言處理(NLP)領(lǐng)域?qū)W術(shù)資料
??? 《樹莓派的人臉識(shí)別教程》
 介紹:用樹莓派和相機(jī)模塊進(jìn)行人臉識(shí)別
??? 《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng) 》
 介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對(duì)話系統(tǒng)
??? 《經(jīng)典論文Leo Breiman:Statistical Modeling: The Two Cultures 》
 介紹:Francis Bach合作的有關(guān)稀疏建模的新綜述(書):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理論,以及在圖像和視覺上的應(yīng)用,而且第一部分關(guān)于Why does the l1-norm induce sparsity的解釋也很不錯(cuò)。
??? 《Reproducing Kernel Hilbert Space》
 介紹:RKHS是機(jī)器學(xué)習(xí)中重要的概念,其在large margin分類器上的應(yīng)用也是廣為熟知的。如果沒有較好的數(shù)學(xué)基礎(chǔ),直接理解RKHS可能會(huì)不易。本文從基本運(yùn)算空間講到Banach和Hilbert空間,深入淺出,一共才12頁(yè)。
??? 《Hacker's guide to Neural Networks》
 介紹:許多同學(xué)對(duì)于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動(dòng)起手來(lái)卻不知道如何下手寫代碼。斯坦福深度學(xué)習(xí)博士Andrej Karpathy寫了一篇實(shí)戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用Javascript寫神經(jīng)網(wǎng)絡(luò)和SVM.
??? 《【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總》
 介紹:【語(yǔ)料庫(kù)】語(yǔ)料庫(kù)資源匯總
??? 《機(jī)器學(xué)習(xí)算法之旅》
 介紹:本文會(huì)過一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。
??? 《Reproducible Research in Computational Science》
 介紹:這個(gè)里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號(hào)處理、計(jì)算機(jī)視覺、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文。科研寫論文的好資源
??? 《NYU 2014年的深度學(xué)習(xí)課程資料》
 介紹:NYU 2014年的深度學(xué)習(xí)課程資料,有視頻
??? 《計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總》
 介紹:計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總
??? 《Machine Learning Open Source Software》
 介紹:機(jī)器學(xué)習(xí)開源軟件
??? 《LIBSVM》
 介紹:A Library for Support Vector Machines
??? 《Support Vector Machines》
 介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一
??? 《100 Best GitHub: Deep Learning》
 介紹:github上面100個(gè)非常棒的項(xiàng)目
??? 《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉(cāng)庫(kù)》
 介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著306個(gè)數(shù)據(jù)集。查詢數(shù)據(jù)集
??? 《Andrej Karpathy個(gè)人主頁(yè)》
 介紹:Andrej Karpathy 是斯坦福大學(xué)Li Fei-Fei的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語(yǔ)義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個(gè)都很扎實(shí),在每一個(gè)問題上都做到了state-of-art.
??? 《Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示》
 介紹:Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示,論文在這里
??? 《CIKM數(shù)據(jù)挖掘競(jìng)賽奪冠算法-陳運(yùn)文》
 介紹:CIKM Cup(或者稱為CIKM Competition)是ACM CIKM舉辦的國(guó)際數(shù)據(jù)挖掘競(jìng)賽的名稱。
??? 《Geoffrey E. Hinton》
 介紹:杰弗里·埃弗里斯特·辛頓 FRS是一位英國(guó)出生的計(jì)算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對(duì)比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動(dòng)者.
??? 《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》
 介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在CIKM2014 上關(guān)于《自然語(yǔ)言處理的深度學(xué)習(xí)理論與實(shí)際》教學(xué)講座的幻燈片
??? 《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價(jià)格預(yù)測(cè)》
 介紹: 本文基于<支持向量機(jī)的高頻限價(jià)訂單的動(dòng)態(tài)建模>采用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價(jià)格運(yùn)動(dòng)預(yù)測(cè)模型。(股票有風(fēng)險(xiǎn),投資謹(jǐn)慎)GitHub源代碼托管地址.
??? 《關(guān)于機(jī)器學(xué)習(xí)的若干理論問題》
 介紹:徐宗本 院士將于熱愛機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個(gè)理論性問題,并給出一些有意義的結(jié)論。最后通過一些實(shí)例來(lái)說(shuō)明這些理論問題的物理意義和實(shí)際應(yīng)用價(jià)值。
??? 《深度學(xué)習(xí)在自然語(yǔ)言處理的應(yīng)用》
 介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書,主要是介紹應(yīng)用層的東西
??? 《Undergraduate machine learning at UBC》
 介紹:機(jī)器學(xué)習(xí)課程
??? 《人臉識(shí)別必讀的N篇文章》
 介紹:人臉識(shí)別必讀文章推薦
??? 《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》
 介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)
??? 《人臉識(shí)別必讀的N篇文章》
 介紹:人臉識(shí)別必讀文章推薦
??? 《第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT》
 介紹:第十二屆中國(guó)"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會(huì)PPT
??? 《統(tǒng)計(jì)機(jī)器學(xué)習(xí)》
 介紹:統(tǒng)計(jì)學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計(jì)模型并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析的一門科學(xué),統(tǒng)計(jì)學(xué)習(xí)也成為統(tǒng)計(jì)機(jī)器學(xué)習(xí)。課程來(lái)自上海交通大學(xué)
??? 《機(jī)器學(xué)習(xí)導(dǎo)論》
 介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對(duì)計(jì)算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗(yàn)來(lái)解決給定的問題.
??? 《CIKM 2014主題報(bào)告的幻燈片》
 介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報(bào)告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報(bào)告的幻燈片
??? 《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項(xiàng)目》
 介紹:部分中文列表
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--基于SMO的SVM分類器》
 介紹:此外作者還有一篇元算法、AdaBoost python實(shí)現(xiàn)文章
??? 《Numerical Optimization: Understanding L-BFGS》
 介紹:加州伯克利大學(xué)博士Aria Haghighi寫了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到BFGS以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。
??? 《簡(jiǎn)明深度學(xué)習(xí)方法概述(一)》
 介紹:還有續(xù)集簡(jiǎn)明深度學(xué)習(xí)方法概述(二)
??? 《R language for programmers》
 介紹:R語(yǔ)言程序員私人定制版
??? 《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
 介紹:谷歌地圖解密
??? 《空間數(shù)據(jù)挖掘常用方法》
 介紹:空間數(shù)據(jù)挖掘常用方法
??? 《Use Google's Word2Vec for movie reviews》
 介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在實(shí)際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過gensim不要忘升級(jí)
??? 《PyNLPIR》
 介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語(yǔ)分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字符和偏旁,中文標(biāo)點(diǎn),拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
??? 《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
 介紹:這文章說(shuō)把最近模型識(shí)別上的突破應(yīng)用到圍棋軟件上,打16萬(wàn)張職業(yè)棋譜訓(xùn)練模型識(shí)別功能。想法不錯(cuò)。訓(xùn)練后目前能做到不用計(jì)算,只看棋盤就給出下一步,大約10級(jí)棋力。但這篇文章太過樂觀,說(shuō)什么人類的最后一塊堡壘馬上就要跨掉了。話說(shuō)得太早。不過,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬(wàn)精油墨綠
??? 《NIPS審稿實(shí)驗(yàn)》
 介紹:UT Austin教授Eric Price關(guān)于今年NIPS審稿實(shí)驗(yàn)的詳細(xì)分析,他表示,根據(jù)這次實(shí)驗(yàn)的結(jié)果,如果今年NIPS重新審稿的話,會(huì)有一半的論文被拒。
??? 《2014年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》
 介紹:KDNuggets分別總結(jié)了2014年14個(gè)閱讀最多以及分享最多的文章。我們從中可以看到多個(gè)主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和Python以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語(yǔ)言
??? 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實(shí)現(xiàn)--線性回歸(Linear Regression)算法》
 介紹:Python實(shí)現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看
??? 《2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF》
 介紹:2014中國(guó)大數(shù)據(jù)技術(shù)大會(huì)33位核心專家演講PDF下載
??? 《使用RNN和Paragraph Vector做情感分析》
 介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不錯(cuò),[項(xiàng)目代碼](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。這意味著Paragraph Vector終于揭開面紗了嘛。
??? 《NLPIR/ICTCLAS2015分詞系統(tǒng)大會(huì)上的技術(shù)演講 》
 介紹:NLPIR/ICTCLAS2015分詞系統(tǒng)發(fā)布與用戶交流大會(huì)上的演講,請(qǐng)更多朋友檢閱新版分詞吧。 我們實(shí)驗(yàn)室同學(xué)的演講包括:孫夢(mèng)姝-基于評(píng)論觀點(diǎn)挖掘的商品搜索技術(shù)研究 李然-主題模型
??? 《Machine Learning is Fun!》
 介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
??? 《CNN的反向求導(dǎo)及練習(xí)》
 介紹:介紹CNN參數(shù)在使用bp算法時(shí)該怎么訓(xùn)練,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個(gè)資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺,數(shù)學(xué)等
??? 《正則表達(dá)式優(yōu)化成Trie樹 》
 介紹:如果要在一篇文章中匹配十萬(wàn)個(gè)關(guān)鍵詞怎么辦?Aho-Corasick 算法利用添加了返回邊的Trie樹,能夠在線性時(shí)間內(nèi)完成匹配。 但如果匹配十萬(wàn)個(gè)正則表達(dá)式呢 ? 這時(shí)候可以用到把多個(gè)正則優(yōu)化成Trie樹的方法,如日本人寫的Regexp::Trie
??? 《Deep learning Reading List》
 介紹:深度學(xué)習(xí)閱讀清單
??? 《Caffe》
 介紹:Caffe是一個(gè)開源的深度學(xué)習(xí)框架,作者目前在google工作,作者主頁(yè)Yangqing Jia (賈揚(yáng)清)
??? 《GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn) 》
 介紹:2014 ImageNet冠軍GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn)模型,GoogleNet論文.
??? 《LambdaNet,Haskell實(shí)現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫(kù) 》
 介紹:LambdaNetLambdaNet是由Haskell實(shí)現(xiàn)的一個(gè)開源的人工神經(jīng)網(wǎng)絡(luò)庫(kù),它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫(kù)還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來(lái)操作現(xiàn)實(shí)世界數(shù)據(jù)。
??? 《百度余凱&張潼機(jī)器學(xué)習(xí)視頻》
 介紹:如果你從事互聯(lián)網(wǎng)搜索,在線廣告,用戶行為分析,圖像識(shí)別,自然語(yǔ)言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測(cè),那么這門核心課程你必須深入了解。
??? 《楊強(qiáng)在TEDxNanjing談智能的起源》
 介紹:"人工智能研究分許多流派。其中之一以IBM為代表,認(rèn)為只要有高性能計(jì)算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智能來(lái)自動(dòng)物本能;還有個(gè)很強(qiáng)的流派認(rèn)為只要找來(lái)專家,把他們的思維用邏輯一條條寫下,放到計(jì)算機(jī)里就行……" 楊強(qiáng)在TEDxNanjing談智能的起源
??? 《深度RNN/LSTM用于結(jié)構(gòu)化學(xué)習(xí) 0)序列標(biāo)注Connectionist Temporal ClassificationICML06》
 介紹:1)機(jī)器翻譯Sequence to Sequence NIPS14 2)成分句法GRAMMAR AS FOREIGN LANGUAGE
??? 《Deep Learning實(shí)戰(zhàn)之word2vec》
 介紹:網(wǎng)易有道的三位工程師寫的word2vec的解析文檔,從基本的詞向量/統(tǒng)計(jì)語(yǔ)言模型->NNLM->Log-Linear/Log-Bilinear->層次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各種tricks,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于word2vec資料的大合集,對(duì)word2vec感興趣的朋友可以看看
??? 《Machine learning open source software》
 介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語(yǔ)言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
??? 《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》
 介紹:作者是計(jì)算機(jī)研二(寫文章的時(shí)候,現(xiàn)在是2015年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語(yǔ)言處理.這是一點(diǎn)他的經(jīng)驗(yàn)之談.對(duì)于入門的朋友或許會(huì)有幫助
??? 《A Tour of Machine Learning Algorithms》
 介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章,非常好
??? 《2014年的《機(jī)器學(xué)習(xí)日?qǐng)?bào)》大合集》
 介紹:機(jī)器學(xué)習(xí)日?qǐng)?bào)里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來(lái)自機(jī)器學(xué)習(xí)日?qǐng)?bào).
??? 《 Image classification with deep learning常用模型》
 介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章
??? 《自動(dòng)語(yǔ)音識(shí)別:深度學(xué)習(xí)方法》
 介紹:作者與Bengio的兄弟Samy 09年合編《自動(dòng)語(yǔ)音識(shí)別:核方法》 3)李開復(fù)1989年《自動(dòng)語(yǔ)音識(shí)別》專著,其博導(dǎo)、94年圖靈獎(jiǎng)得主Raj Reddy作序
??? 《NLP中的中文分詞技術(shù)》
 介紹: 作者是360電商技術(shù)組成員,這是一篇NLP在中文分詞中的應(yīng)用
??? 《Using convolutional neural nets to detect facial keypoints tutorial》
 介紹: 使用deep learning的人臉關(guān)鍵點(diǎn)檢測(cè),此外還有一篇AWS部署教程
??? 《書籍推薦:Advanced Structured Prediction》
 介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG ,匯集了結(jié)構(gòu)化預(yù)測(cè)領(lǐng)域諸多牛文,涉及CV、NLP等領(lǐng)域,值得一讀。網(wǎng)上公開的幾章草稿:一,二,三,四,五
??? 《An Introduction to Matrix Concentration Inequalities》
 介紹: Tropp把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語(yǔ)言寫的矩陣概率不等式用初等的方法寫出來(lái),是非常好的手冊(cè),領(lǐng)域內(nèi)的paper各種證明都在用里面的結(jié)果。雖說(shuō)是初等的,但還是非常的難
??? 《The free big data sources you should know》
 介紹: 不容錯(cuò)過的免費(fèi)大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽說(shuō),內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧,具體包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等
??? 《A Brief Overview of Deep Learning》
 介紹: 谷歌科學(xué)家、Hinton親傳弟子Ilya Sutskever的深度學(xué)習(xí)綜述及實(shí)際建議
??? 《A Deep Dive into Recurrent Neural Nets》
 介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了RNN的概念、原理、訓(xùn)練及優(yōu)化等各個(gè)方面內(nèi)容,強(qiáng)烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦
??? 《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
 介紹:里面融合了很多的資源,例如競(jìng)賽,在線課程,demo,數(shù)據(jù)整合等。有分類
??? 《Statistical foundations of machine learning》
 介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計(jì)基礎(chǔ)》在線版,該手冊(cè)希望在理論與實(shí)踐之間找到平衡點(diǎn),各主要內(nèi)容都伴有實(shí)際例子及數(shù)據(jù),書中的例子程序都是用R語(yǔ)言編寫的。
??? 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
 介紹:IVAN VASILEV寫的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀
??? 《Research priorities for robust and beneficial artificial intelligence》
 介紹:魯棒及有益的人工智能優(yōu)先研究計(jì)劃:一封公開信,目前已經(jīng)有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人簽署The Future of Life Institute (FLI).這封信的背景是最近霍金和Elon Musk提醒人們注意AI的潛在威脅。公開信的內(nèi)容是AI科學(xué)家們站在造福社會(huì)的角度,展望人工智能的未來(lái)發(fā)展方向,提出開發(fā)AI系統(tǒng)的Verification,Validity, Security, Control四點(diǎn)要求,以及需要注意的社會(huì)問題。畢竟當(dāng)前AI在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實(shí)還有一部美劇《疑犯追蹤》,介紹了AI的演進(jìn)從一開始的自我學(xué)習(xí),過濾,圖像識(shí)別,語(yǔ)音識(shí)別等判斷危險(xiǎn),到第四季的時(shí)候出現(xiàn)了機(jī)器通過學(xué)習(xí)成長(zhǎng)之后想控制世界的狀態(tài)。說(shuō)到這里推薦收看。
??? 《metacademy》
 介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識(shí)結(jié)構(gòu),路線圖,用時(shí)長(zhǎng)短等。號(hào)稱是”機(jī)器學(xué)習(xí)“搜索引擎
??? 《FAIR open sources deep-learning modules for Torch》
 介紹:Facebook人工智能研究院(FAIR)開源了一系列軟件庫(kù),以幫助開發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開放的軟件庫(kù)在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
??? 《淺析人臉檢測(cè)之Haar分類器方法》
 介紹:本文雖然是寫于2012年,但是這篇文章完全是作者的經(jīng)驗(yàn)之作。
??? 《如何成為一位數(shù)據(jù)科學(xué)家》
 介紹:本文是對(duì)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》作者Peter Harrington做的一個(gè)訪談。包含了書中部分的疑問解答和一點(diǎn)個(gè)人學(xué)習(xí)建議
??? 《Deep learning from the bottom up》
 介紹:非常好的深度學(xué)習(xí)概述,對(duì)幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論
??? 《Hands-On Data Science with R Text Mining》
 介紹:主要是講述了利用R語(yǔ)言進(jìn)行數(shù)據(jù)挖掘
??? 《Understanding Convolutions》
 介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒
??? 《Introduction to Deep Learning Algorithms》
 介紹:Deep Learning算法介紹,里面介紹了06年3篇讓deep learning崛起的論文
??? 《Learning Deep Architectures for AI》
 介紹:一本學(xué)習(xí)人工智能的書籍,作者是Yoshua Bengio,相關(guān)國(guó)內(nèi)報(bào)道
??? 《Geoffrey E. Hinton個(gè)人主頁(yè)》
 介紹:Geoffrey Hinton是Deep Learning的大牛,他的主頁(yè)放了一些介紹性文章和課件值得學(xué)習(xí)
??? 《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
 介紹:概率論:數(shù)理邏輯書籍
??? 《H2O》
 介紹:一個(gè)用來(lái)快速的統(tǒng)計(jì),機(jī)器學(xué)習(xí)并且對(duì)于數(shù)據(jù)量大的數(shù)學(xué)庫(kù)
??? 《ICLR 2015會(huì)議的arXiv稿件合集》
 介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動(dòng)向。
??? 《Introduction to Information Retrieval》
 介紹:此書在信息檢索領(lǐng)域家喻戶曉, 除提供該書的免費(fèi)電子版外,還提供一個(gè)IR資源列表 ,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實(shí)現(xiàn)等方面相關(guān)的圖書、研究中心、相關(guān)課程、子領(lǐng)域、會(huì)議、期刊等等,堪稱全集,值得收藏
??? 《Information Geometry and its Applications to Machine Learning》
 介紹:信息幾何學(xué)及其在機(jī)器學(xué)習(xí)中的應(yīng)用
參考文獻(xiàn):http://ask.julyedu.com/article/59
 ??? 《Legal Analytics – Introduction to the Course》
 介紹:課程《法律分析》介紹幻燈片。用機(jī)器學(xué)習(xí)解決法律相關(guān)分析和預(yù)測(cè)問題,相關(guān)的法律應(yīng)用包括預(yù)測(cè)編碼、早期案例評(píng)估、案件整體情況的預(yù)測(cè),定價(jià)和工作人員預(yù)測(cè),司法行為預(yù)測(cè)等。法律領(lǐng)域大家可能都比較陌生,不妨了解下。
??? 《文本上的算法》
 介紹: 文中提到了最優(yōu),模型,最大熵等等理論,此外還有應(yīng)用篇。推薦系統(tǒng)可以說(shuō)是一本不錯(cuò)的閱讀稿,關(guān)于模型還推薦一篇Generative Model 與 Discriminative Model
??? 《NeuralTalk》
 介紹: NeuralTalk is a Python+numpy project for learning Multimodal Recurrent Neural Networks that describe images with sentences.NeuralTalk是一個(gè)Python的從圖像生成自然語(yǔ)言描述的工具。它實(shí)現(xiàn)了Google (Vinyals等,卷積神經(jīng)網(wǎng)絡(luò)CNN + 長(zhǎng)短期記憶LSTM) 和斯坦福 (Karpathy and Fei-Fei, CNN + 遞歸神經(jīng)網(wǎng)絡(luò)RNN)的算法。NeuralTalk自帶了一個(gè)訓(xùn)練好的動(dòng)物模型,你可以拿獅子大象的照片來(lái)試試看
??? 《Deep Learning on Hadoop 2.0》
 介紹:本文主要介紹了在Hadoop2.0上使用深度學(xué)習(xí),文章來(lái)自paypal
??? 《Practical recommendations for gradient-based training of deep architectures》
 介紹:用基于梯度下降的方法訓(xùn)練深度框架的實(shí)踐推薦指導(dǎo),作者是Yoshua Bengio .感謝@xuewei4d 推薦
??? 《Machine Learning With Statistical And Causal Methods》
 介紹: 用統(tǒng)計(jì)和因果方法做機(jī)器學(xué)習(xí)(視頻報(bào)告)
??? 《Machine Learning Course 180’》
 介紹: 一個(gè)講機(jī)器學(xué)習(xí)的Youtube視頻教程。160集。系統(tǒng)程度跟書可比擬。
??? 《回歸(regression)、梯度下降(gradient descent)》
 介紹: 機(jī)器學(xué)習(xí)中的數(shù)學(xué),作者的研究方向是機(jī)器學(xué)習(xí),并行計(jì)算如果你還想了解一點(diǎn)其他的可以看看他博客的其他文章
??? 《美團(tuán)推薦算法實(shí)踐》
 介紹: 美團(tuán)推薦算法實(shí)踐,從框架,應(yīng)用,策略,查詢等分析
??? 《Deep Learning for Answer Sentence Selection》
 介紹: 深度學(xué)習(xí)用于問答系統(tǒng)答案句的選取
??? 《Learning Semantic Representations Using Convolutional Neural Networks for Web Search 》
 介紹: CNN用于WEB搜索,深度學(xué)習(xí)在文本計(jì)算中的應(yīng)用
??? 《Awesome Public Datasets》
 介紹: Awesome系列中的公開數(shù)據(jù)集
??? 《Search Engine & Community》
 介紹: 一個(gè)學(xué)術(shù)搜索引擎
??? 《spaCy》
 介紹: 用Python和Cython寫的工業(yè)級(jí)自然語(yǔ)言處理庫(kù),號(hào)稱是速度最快的NLP庫(kù),快的原因一是用Cython寫的,二是用了個(gè)很巧妙的hash技術(shù),加速系統(tǒng)的瓶頸,NLP中稀松特征的存取
??? 《Collaborative Filtering with Spark》
 介紹: Fields是個(gè)數(shù)學(xué)研究中心,上面的這份ppt是來(lái)自Fields舉辦的活動(dòng)中Russ Salakhutdinov帶來(lái)的《大規(guī)模機(jī)器學(xué)習(xí)》分享
??? 《Topic modeling 的經(jīng)典論文》
 介紹: Topic modeling 的經(jīng)典論文,標(biāo)注了關(guān)鍵點(diǎn)
??? 《Move Evaluation in Go Using Deep Convolutional Neural Networks》
 介紹: 多倫多大學(xué)與Google合作的新論文,深度學(xué)習(xí)也可以用來(lái)下圍棋,據(jù)說(shuō)能達(dá)到六段水平
??? 《機(jī)器學(xué)習(xí)周刊第二期》
 介紹: 新聞,paper,課程,book,system,CES,Roboot,此外還推薦一個(gè)深度學(xué)習(xí)入門與綜述資料
??? 《Learning more like a human: 18 free eBooks on Machine Learning》
 介紹: 18 free eBooks on Machine Learning
??? 《Recommend :Hang Li Home》
 介紹:Chief scientist of Noah's Ark Lab of Huawei Technologies.He worked at the Research Laboratories of NEC Corporation during 1990 and 2001 and Microsoft Research Asia during 2001 and 2012.Paper
??? 《DEEPLEARNING.UNIVERSITY – AN ANNOTATED DEEP LEARNING BIBLIOGRAPHY》
 介紹: DEEPLEARNING.UNIVERSITY的論文庫(kù)已經(jīng)收錄了963篇經(jīng)過分類的深度學(xué)習(xí)論文了,很多經(jīng)典論文都已經(jīng)收錄
??? 《MLMU.cz - Radim ?eh??ek - Word2vec & friends (7.1.2015)》
 介紹: Radim ?eh??ek(Gensim開發(fā)者)在一次機(jī)器學(xué)習(xí)聚會(huì)上的報(bào)告,關(guān)于word2vec及其優(yōu)化、應(yīng)用和擴(kuò)展,很實(shí)用.國(guó)內(nèi)網(wǎng)盤
??? 《Introducing streaming k-means in Spark 1.2》
 介紹:很多公司都用機(jī)器學(xué)習(xí)來(lái)解決問題,提高用戶體驗(yàn)。那么怎么可以讓機(jī)器學(xué)習(xí)更實(shí)時(shí)和有效呢?Spark MLlib 1.2里面的Streaming K-means,由斑馬魚腦神經(jīng)研究的Jeremy Freeman腦神經(jīng)科學(xué)家編寫,最初是為了實(shí)時(shí)處理他們每半小時(shí)1TB的研究數(shù)據(jù),現(xiàn)在發(fā)布給大家用了。
??? 《LDA入門與Java實(shí)現(xiàn)》
 介紹: 這是一篇面向工程師的LDA入門筆記,并且提供一份開箱即用Java實(shí)現(xiàn)。本文只記錄基本概念與原理,并不涉及公式推導(dǎo)。文中的LDA實(shí)現(xiàn)核心部分采用了arbylon的LdaGibbsSampler并力所能及地注解了,在搜狗分類語(yǔ)料庫(kù)上測(cè)試良好,開源在GitHub上。
??? 《AMiner - Open Science Platform》
 介紹: AMiner是一個(gè)學(xué)術(shù)搜索引擎,從學(xué)術(shù)網(wǎng)絡(luò)中挖掘深度知識(shí)、面向科技大數(shù)據(jù)的挖掘。收集近4000萬(wàn)作者信息、8000萬(wàn)論文信息、1億多引用關(guān)系、鏈接近8百萬(wàn)知識(shí)點(diǎn);支持專家搜索、機(jī)構(gòu)排名、科研成果評(píng)價(jià)、會(huì)議排名。
??? 《What are some interesting Word2Vec results?》
 介紹: Quora上的主題,討論Word2Vec的有趣應(yīng)用,Omer Levy提到了他在CoNLL2014最佳論文里的分析結(jié)果和新方法,Daniel Hammack給出了找特異詞的小應(yīng)用并提供了(Python)代碼
??? 《機(jī)器學(xué)習(xí)公開課匯總》
 介紹: 機(jī)器學(xué)習(xí)公開課匯總,雖然里面的有些課程已經(jīng)歸檔過了,但是還有個(gè)別的信息沒有。感謝課程圖譜的小編
??? 《A First Course in Linear Algebra》
 介紹: 【A First Course in Linear Algebra】Robert Beezer 有答案 有移動(dòng)版、打印版 使用GNU自由文檔協(xié)議 引用了杰弗遜1813年的信
??? 《libfacedetection》
 介紹:libfacedetection是深圳大學(xué)開源的一個(gè)人臉圖像識(shí)別庫(kù)。包含正面和多視角人臉檢測(cè)兩個(gè)算法.優(yōu)點(diǎn):速度快(OpenCV haar+adaboost的2-3倍), 準(zhǔn)確度高 (FDDB非公開類評(píng)測(cè)排名第二),能估計(jì)人臉角度。
??? 《Inverting a Steady-State》
 介紹:WSDM2015最佳論文 把馬爾可夫鏈理論用在了圖分析上面,比一般的propagation model更加深刻一些。通過全局的平穩(wěn)分布去求解每個(gè)節(jié)點(diǎn)影響系數(shù)模型。假設(shè)合理(轉(zhuǎn)移受到相鄰的影響系數(shù)影響)。可以用來(lái)反求每個(gè)節(jié)點(diǎn)的影響系數(shù)
??? 《機(jī)器學(xué)習(xí)入門書單》
 介紹:機(jī)器學(xué)習(xí)入門書籍,具體介紹
??? 《The Trouble with SVMs》
 介紹: 非常棒的強(qiáng)調(diào)特征選擇對(duì)分類器重要性的文章。情感分類中,根據(jù)互信息對(duì)復(fù)雜高維特征降維再使用樸素貝葉斯分類器,取得了比SVM更理想的效果,訓(xùn)練和分類時(shí)間也大大降低——更重要的是,不必花大量時(shí)間在學(xué)習(xí)和優(yōu)化SVM上——特征也一樣no free lunch
??? 《Rise of the Machines》
 介紹:CMU的統(tǒng)計(jì)系和計(jì)算機(jī)系知名教授Larry Wasserman 在《機(jī)器崛起》,對(duì)比了統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的差異
??? 《實(shí)例詳解機(jī)器學(xué)習(xí)如何解決問題》
 介紹:隨著大數(shù)據(jù)時(shí)代的到來(lái),機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界,機(jī)器學(xué)習(xí)都是一個(gè)炙手可熱的方向,但是學(xué)術(shù)界和工業(yè)界對(duì)機(jī)器學(xué)習(xí)的研究各有側(cè)重,學(xué)術(shù)界側(cè)重于對(duì)機(jī)器學(xué)習(xí)理論的研究,工業(yè)界側(cè)重于如何用機(jī)器學(xué)習(xí)來(lái)解決實(shí)際問題。這篇文章是美團(tuán)的實(shí)際環(huán)境中的實(shí)戰(zhàn)篇
??? 《Gaussian Processes for Machine Learning》
 介紹:面向機(jī)器學(xué)習(xí)的高斯過程,章節(jié)概要:回歸、分類、協(xié)方差函數(shù)、模型選擇與超參優(yōu)化、高斯模型與其他模型關(guān)系、大數(shù)據(jù)集的逼近方法等,微盤下載
??? 《FuzzyWuzzy: Fuzzy String Matching in Python》
 介紹:Python下的文本模糊匹配庫(kù),老庫(kù)新推,可計(jì)算串間ratio(簡(jiǎn)單相似系數(shù))、partial_ratio(局部相似系數(shù))、token_sort_ratio(詞排序相似系數(shù))、token_set_ratio(詞集合相似系數(shù))等 github
??? 《Blocks》
 介紹:Blocks是基于Theano的神經(jīng)網(wǎng)絡(luò)搭建框架,集成相關(guān)函數(shù)、管道和算法,幫你更快地創(chuàng)建和管理NN模塊.
??? 《Introduction to Machine Learning》
 介紹:機(jī)器學(xué)習(xí)大神Alex Smola在CMU新一期的機(jī)器學(xué)習(xí)入門課程”Introduction to Machine Learning“近期剛剛開課,課程4K高清視頻同步到Y(jié)outube上,目前剛剛更新到 2.4 Exponential Families,課程視頻playlist, 感興趣的同學(xué)可以關(guān)注,非常適合入門.
??? 《Collaborative Feature Learning from Social Media》
 介紹:用社交用戶行為學(xué)習(xí)圖片的協(xié)同特征,可更好地表達(dá)圖片內(nèi)容相似性。由于不依賴于人工標(biāo)簽(標(biāo)注),可用于大規(guī)模圖片處理,難在用戶行為數(shù)據(jù)的獲取和清洗;利用社會(huì)化特征的思路值得借鑒.
??? 《Introducing practical and robust anomaly detection in a time series》
 介紹:Twitter技術(shù)團(tuán)隊(duì)對(duì)前段時(shí)間開源的時(shí)間序列異常檢測(cè)算法(S-H-ESD)R包的介紹,其中對(duì)異常的定義和分析很值得參考,文中也提到——異常是強(qiáng)針對(duì)性的,某個(gè)領(lǐng)域開發(fā)的異常檢測(cè)在其他領(lǐng)域直接用可不行.
??? 《Empower Your Team to Deal with Data-Quality Issues》
 介紹:聚焦數(shù)據(jù)質(zhì)量問題的應(yīng)對(duì),數(shù)據(jù)質(zhì)量對(duì)各種規(guī)模企業(yè)的性能和效率都至關(guān)重要,文中總結(jié)出(不限于)22種典型數(shù)據(jù)質(zhì)量問題顯現(xiàn)的信號(hào),以及典型的數(shù)據(jù)質(zhì)量解決方案(清洗、去重、統(tǒng)一、匹配、權(quán)限清理等)
??? 《中文分詞入門之資源》
 介紹:中文分詞入門之資源.
??? 《Deep Learning Summit, San Francisco, 2015》
 介紹:15年舊金山深度學(xué)習(xí)峰會(huì)視頻集萃,國(guó)內(nèi)云盤
??? 《Introduction to Conditional Random Fields》
 介紹:很好的條件隨機(jī)場(chǎng)(CRF)介紹文章,作者的學(xué)習(xí)筆記
??? 《A Fast and Accurate Dependency Parser using Neural Networks》
 介紹: 來(lái)自Stanford,用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)快速準(zhǔn)確的依存關(guān)系解析器
??? 《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》
 介紹:做深度學(xué)習(xí)如何選擇GPU的建議
??? 《Sparse Linear Models》
 介紹: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的報(bào)告,講稀疏線性模型——面向“寬數(shù)據(jù)”(特征維數(shù)超過樣本數(shù))的線性模型,13年同主題報(bào)告 、講義.
??? 《Awesome Computer Vision》
 介紹: 分類整理的機(jī)器視覺相關(guān)資源列表,秉承Awesome系列風(fēng)格,有質(zhì)有量!作者的更新頻率也很頻繁
??? 《Adam Szeidl》
 介紹: social networks course
??? 《Building and deploying large-scale machine learning pipelines》
 介紹: 大規(guī)模機(jī)器學(xué)習(xí)流程的構(gòu)建與部署.
??? 《人臉識(shí)別開發(fā)包》
 介紹: 人臉識(shí)別二次開發(fā)包,免費(fèi),可商用,有演示、范例、說(shuō)明書.
??? 《Understanding Natural Language with Deep Neural Networks Using Torch》
 介紹: 采用Torch用深度學(xué)習(xí)網(wǎng)絡(luò)理解NLP,來(lái)自Facebook 人工智能的文章.
??? 《The NLP Engine: A Universal Turing Machine for NLP》
 介紹: 來(lái)自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy來(lái)刻畫NLP中各項(xiàng)任務(wù)的難度.
??? 《TThe Probabilistic Relevance Framework: BM25 and Beyond》
 介紹: 信息檢索排序模型BM25(Besting Matching)。1)從經(jīng)典概率模型演變而來(lái) 2)捕捉了向量空間模型中三個(gè)影響索引項(xiàng)權(quán)重的因子:IDF逆文檔頻率;TF索引項(xiàng)頻率;文檔長(zhǎng)度歸一化。3)并且含有集成學(xué)習(xí)的思想:組合了BM11和BM15兩個(gè)模型。4)作者是BM25的提出者和Okapi實(shí)現(xiàn)者Robertson.
??? 《Introduction to ARMA Time Series Models – simplified》
 介紹: 自回歸滑動(dòng)平均(ARMA)時(shí)間序列的簡(jiǎn)單介紹,ARMA是研究時(shí)間序列的重要方法,由自回歸模型(AR模型)與滑動(dòng)平均模型(MA模型)為基礎(chǔ)“混合”構(gòu)成.
??? 《Encoding Source Language with Convolutional Neural Network for Machine Translation》
 介紹: 把來(lái)自target的attention signal加入source encoding CNN的輸入,得到了比BBN的模型好的多neural network joint model
??? 《Spices form the basis of food pairing in Indian cuisine》
 介紹: 揭開印度菜的美味秘訣——通過對(duì)大量食譜原料關(guān)系的挖掘,發(fā)現(xiàn)印度菜美味的原因之一是其中的味道互相沖突,很有趣的文本挖掘研究
??? 《HMM相關(guān)文章索引》
 介紹: HMM相關(guān)文章
??? 《Zipf's and Heap's law》
 介紹: 1)詞頻與其降序排序的關(guān)系,最著名的是語(yǔ)言學(xué)家齊夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比關(guān)系. 曼德勃羅(Mandelbrot,1924- 2010)引入?yún)?shù)修正了對(duì)甚高頻和甚低頻詞的刻畫 2)Heaps' law: 詞匯表與語(yǔ)料規(guī)模的平方根(這是一個(gè)參數(shù),英語(yǔ)0.4-0.6)成正比
??? 《I am Jürgen Schmidhuber, AMA》
 介紹: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主題,有不少RNN和AI、ML的干貨內(nèi)容,關(guān)于開源&思想&方法&建議……耐心閱讀,相信你也會(huì)受益匪淺.
??? 《學(xué)術(shù)種子網(wǎng)站:AcademicTorrents》
 介紹: 成G上T的學(xué)術(shù)數(shù)據(jù),HN近期熱議話題,主題涉及機(jī)器學(xué)習(xí)、NLP、SNA等。下載最簡(jiǎn)單的方法,通過BT軟件,RSS訂閱各集合即可
??? 《機(jī)器學(xué)習(xí)交互速查表》
 介紹: Scikit-Learn官網(wǎng)提供,在原有的Cheat Sheet基礎(chǔ)上加上了Scikit-Learn相關(guān)文檔的鏈接,方便瀏覽
??? 《A Full Hardware Guide to Deep Learning》
 介紹: 深度學(xué)習(xí)的全面硬件指南,從GPU到RAM、CPU、SSD、PCIe
??? 《行人檢測(cè)(Pedestrian Detection)資源》
 介紹:Pedestrian Detection paper & data
??? 《A specialized face-processing network consistent with the representational geometry of monkey face patches》
 介紹: 【神經(jīng)科學(xué)碰撞人工智能】在臉部識(shí)別上你我都是專家,即使細(xì)微的差別也能辨認(rèn)。研究已證明人類和靈長(zhǎng)類動(dòng)物在面部加工上不同于其他物種,人類使用梭狀回面孔區(qū)(FFA)。Khaligh-Razavi等通過計(jì)算機(jī)模擬出人臉識(shí)別的FFA活動(dòng),堪稱神經(jīng)科學(xué)與人工智能的完美結(jié)合。
??? 《Neural Net in C++ Tutorial》
 介紹: 神經(jīng)網(wǎng)絡(luò)C++教程,本文介紹了用可調(diào)節(jié)梯度下降和可調(diào)節(jié)動(dòng)量法設(shè)計(jì)和編碼經(jīng)典BP神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)經(jīng)過訓(xùn)練可以做出驚人和美妙的東西出來(lái)。此外作者博客的其他文章也很不錯(cuò)。
??? 《How to Choose a Neural Network》
 介紹:deeplearning4j官網(wǎng)提供的實(shí)際應(yīng)用場(chǎng)景NN選擇參考表,列舉了一些典型問題建議使用的神經(jīng)網(wǎng)絡(luò)
??? 《Deep Learning (Python, C/C++, Java, Scala, Go)》
 介紹:一個(gè)深度學(xué)習(xí)項(xiàng)目,提供了Python, C/C++, Java, Scala, Go多個(gè)版本的代碼
??? 《Deep Learning Tutorials》
 介紹:深度學(xué)習(xí)教程
??? 《自然語(yǔ)言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授》
 介紹:自然語(yǔ)言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授.
??? 《FaceNet: A Unified Embedding for Face Recognition and Clustering》
 介紹:Google對(duì)Facebook DeepFace的有力回?fù)簟?FaceNet,在LFW(Labeled Faces in the Wild)上達(dá)到99.63%準(zhǔn)確率(新紀(jì)錄),FaceNet embeddings可用于人臉識(shí)別、鑒別和聚類.
??? 《MLlib中的Random Forests和Boosting》
 介紹:本文來(lái)自Databricks公司網(wǎng)站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們?cè)贛Llib中的分布式實(shí)現(xiàn),以及展示一些簡(jiǎn)單的例子并建議該從何處上手.中文版.
??? 《Sum-Product Networks(SPN) 》
 介紹:華盛頓大學(xué)Pedro Domingos團(tuán)隊(duì)的DNN,提供論文和實(shí)現(xiàn)代碼.
??? 《Neural Network Dependency Parser》
 介紹:基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言依存關(guān)系解析器(已集成至Stanford CoreNLP),特點(diǎn)是超快、準(zhǔn)確,目前可處理中英文語(yǔ)料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路實(shí)現(xiàn).
??? 《神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型》
 介紹:本文根據(jù)神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,詳細(xì)講解神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型在各個(gè)階段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結(jié)的特別好.
??? 《Classifying Spam Emails using Text and Readability Features》
 介紹:經(jīng)典問題的新研究:利用文本和可讀性特征分類垃圾郵件。
??? 《BCI Challenge @ NER 2015》
 介紹:Kaggle腦控計(jì)算機(jī)交互(BCI)競(jìng)賽優(yōu)勝方案源碼及文檔,包括完整的數(shù)據(jù)處理流程,是學(xué)習(xí)Python數(shù)據(jù)處理和Kaggle經(jīng)典參賽框架的絕佳實(shí)例
??? 《IPOL Journal · Image Processing On Line》
 介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個(gè)算法及相應(yīng)的代碼、Demo和實(shí)驗(yàn)文檔。文本和源碼是經(jīng)過了同行評(píng)審的。IPOL是開放的科學(xué)和可重復(fù)的研究期刊。我一直想做點(diǎn)類似的工作,拉近產(chǎn)品和技術(shù)之間的距離.
??? 《Machine learning classification over encrypted data》
 介紹:出自MIT,研究加密數(shù)據(jù)高效分類問題.
??? 《purine2》
 介紹:新加坡LV實(shí)驗(yàn)室的神經(jīng)網(wǎng)絡(luò)并行框架Purine: A bi-graph based deep learning framework,支持構(gòu)建各種并行的架構(gòu),在多機(jī)多卡,同步更新參數(shù)的情況下基本達(dá)到線性加速。12塊Titan 20小時(shí)可以完成Googlenet的訓(xùn)練。
??? 《Machine Learning Resources》
 介紹:這是一個(gè)機(jī)器學(xué)習(xí)資源庫(kù),雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個(gè)由zheng Rui整理的機(jī)器學(xué)習(xí)資源.
??? 《Hands-on with machine learning》
 介紹:Chase Davis在NICAR15上的主題報(bào)告材料,用Scikit-Learn做監(jiān)督學(xué)習(xí)的入門例子.
??? 《The Natural Language Processing Dictionary》
 介紹:這是一本自然語(yǔ)言處理的詞典,從1998年開始到目前積累了成千上萬(wàn)的專業(yè)詞語(yǔ)解釋,如果你是一位剛?cè)腴T的朋友.可以借這本詞典讓自己成長(zhǎng)更快.
??? 《PageRank Approach to Ranking National Football Teams》
 介紹:通過分析1930年至今的比賽數(shù)據(jù),用PageRank計(jì)算世界杯參賽球隊(duì)排行榜.
??? 《R Tutorial》
 介紹:R語(yǔ)言教程,此外還推薦一個(gè)R語(yǔ)言教程An Introduction to R.
??? 《Fast unfolding of communities in large networks》
 介紹:經(jīng)典老文,復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.
??? 《NUML》
 介紹: 一個(gè)面向 .net 的開源機(jī)器學(xué)習(xí)庫(kù),github地址
??? 《synaptic.Js》
 介紹: 支持node.js的JS神經(jīng)網(wǎng)絡(luò)庫(kù),可在客戶端瀏覽器中運(yùn)行,支持LSTM等 github地址
??? 《Machine learning for package users with R (1): Decision Tree》
 介紹: 決策樹
??? 《Deep Learning, The Curse of Dimensionality, and Autoencoders》
 介紹: 討論深度學(xué)習(xí)自動(dòng)編碼器如何有效應(yīng)對(duì)維數(shù)災(zāi)難,國(guó)內(nèi)翻譯
??? 《Advanced Optimization and Randomized Methods》
 介紹: CMU的優(yōu)化與隨機(jī)方法課程,由A. Smola和S. Sra主講,優(yōu)化理論是機(jī)器學(xué)習(xí)的基石,值得深入學(xué)習(xí) 國(guó)內(nèi)云(視頻)
??? 《CS231n: Convolutional Neural Networks for Visual Recognition》
 介紹: "面向視覺識(shí)別的CNN"課程設(shè)計(jì)報(bào)告集錦.近百篇,內(nèi)容涉及圖像識(shí)別應(yīng)用的各個(gè)方面
??? 《Topic modeling with LDA: MLlib meets GraphX》
 介紹:用Spark的MLlib+GraphX做大規(guī)模LDA主題抽取.
??? 《Deep Learning for Multi-label Classification》
 介紹: 基于深度學(xué)習(xí)的多標(biāo)簽分類,用基于RBM的DBN解決多標(biāo)簽分類(特征)問題
??? 《Google DeepMind publications》
 介紹: DeepMind論文集錦
??? 《kaldi》
 介紹: 一個(gè)開源語(yǔ)音識(shí)別工具包,它目前托管在sourceforge上面
??? 《Data Journalism Handbook》
 介紹: 免費(fèi)電子書《數(shù)據(jù)新聞手冊(cè)》, 國(guó)內(nèi)有熱心的朋友翻譯了中文版,大家也可以在線閱讀
??? 《Data Mining Problems in Retail》
 介紹: 零售領(lǐng)域的數(shù)據(jù)挖掘文章.
??? 《Understanding Convolution in Deep Learning》
 介紹: 深度學(xué)習(xí)卷積概念詳解,深入淺出.
??? 《pandas: powerful Python data analysis toolkit》
 介紹: 非常強(qiáng)大的Python的數(shù)據(jù)分析工具包.
??? 《Text Analytics 2015》
 介紹: 2015文本分析(商業(yè))應(yīng)用綜述.
??? 《Deep Learning libraries and ?rst experiments with Theano》
 介紹: 深度學(xué)習(xí)框架、庫(kù)調(diào)研及Theano的初步測(cè)試體會(huì)報(bào)告.
??? 《DEEP learning》
 介紹: MIT的Yoshua Bengio等人講深度學(xué)習(xí)的新書,還未定稿,線上提供Draft chapters收集反饋,超贊!強(qiáng)烈推薦.
??? 《simplebayes》
 介紹: Python下開源可持久化樸素貝葉斯分類庫(kù).
??? 《Paracel》
 介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
??? 《HanLP:Han Language processing》
 介紹: 開源漢語(yǔ)言處理包.
??? 《Simple Neural Network implementation in Ruby》
 介紹: 使用Ruby實(shí)現(xiàn)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)例子.
??? 《Hacker's guide to Neural Networks》
 介紹:神經(jīng)網(wǎng)絡(luò)黑客入門.
??? 《The Open-Source Data Science Masters》
 介紹:好多數(shù)據(jù)科學(xué)家名人推薦,還有資料.
??? 《Text Understanding from Scratch》
 介紹:實(shí)現(xiàn)項(xiàng)目已經(jīng)開源在github上面Crepe
??? 《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
 介紹:作者發(fā)現(xiàn),經(jīng)過調(diào)參,傳統(tǒng)的方法也能和word2vec取得差不多的效果。另外,無(wú)論作者怎么試,GloVe都比不過word2vec.
??? 《CS224d: Deep Learning for Natural Language Processing》
 介紹:Stanford深度學(xué)習(xí)與自然語(yǔ)言處理課程,Richard Socher主講.
??? 《Math Essentials in Machine Learning》
 介紹:機(jī)器學(xué)習(xí)中的重要數(shù)學(xué)概念.
??? 《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
 介紹:用于改進(jìn)語(yǔ)義表示的樹型LSTM遞歸神經(jīng)網(wǎng)絡(luò),句子級(jí)相關(guān)性判斷和情感分類效果很好.實(shí)現(xiàn)代碼.
??? 《Statistical Machine Learning》
 介紹:卡耐基梅隆Ryan Tibshirani和Larry Wasserman開設(shè)的機(jī)器學(xué)習(xí)課程,先修課程為機(jī)器學(xué)習(xí)(10-715)和中級(jí)統(tǒng)計(jì)學(xué)(36-705),聚焦統(tǒng)計(jì)理論和方法在機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用.
??? 《AM207: Monte Carlo Methods, Stochastic Optimization》
 介紹:《哈佛大學(xué)蒙特卡洛方法與隨機(jī)優(yōu)化課程》是哈佛應(yīng)用數(shù)學(xué)研究生課程,由V Kaynig-Fittkau、P Protopapas主講,Python程序示例,對(duì)貝葉斯推理感興趣的朋友一定要看看,提供授課視頻及課上IPN講義.
??? 《生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用》
 介紹:生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用.并且伯克利開源了他們的big data genomics系統(tǒng)ADAM,其他的內(nèi)容可以關(guān)注一下官方主頁(yè).
??? 《ACL Anthology》
 介紹:對(duì)自然語(yǔ)言處理技術(shù)或者機(jī)器翻譯技術(shù)感興趣的親們,請(qǐng)?jiān)谔岢鲎约号1频綗o(wú)以倫比的idea(自動(dòng)歸納翻譯規(guī)律、自動(dòng)理解語(yǔ)境、自動(dòng)識(shí)別語(yǔ)義等等)之前,請(qǐng)通過谷歌學(xué)術(shù)簡(jiǎn)單搜一下,如果谷歌不可用,這個(gè)網(wǎng)址有這個(gè)領(lǐng)域幾大頂會(huì)的論文列表,切不可斷章取義,胡亂假設(shè).
??? 《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
 介紹:論文+代碼:基于集成方法的Twitter情感分類,實(shí)現(xiàn)代碼.
??? 《NIPS 2014 CIML workshop》
 介紹:NIPS CiML 2014的PPT,NIPS是神經(jīng)信息處理系統(tǒng)進(jìn)展大會(huì)的英文簡(jiǎn)稱.
??? 《CS231n: Convolutional Neural Networks for Visual Recognition》
 介紹:斯坦福的深度學(xué)習(xí)課程的Projects 每個(gè)人都要寫一個(gè)論文級(jí)別的報(bào)告 里面有一些很有意思的應(yīng)用 大家可以看看 .
??? 《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
 介紹:R語(yǔ)言線性回歸多方案速度比較具體方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.
??? 《Back-to-Basics Weekend Reading - Machine Learning》
 介紹:文中提到的三篇論文(機(jī)器學(xué)習(xí)那些事、無(wú)監(jiān)督聚類綜述、監(jiān)督分類綜述)都很經(jīng)典,Domnigos的機(jī)器學(xué)習(xí)課也很精彩
??? 《A Probabilistic Theory of Deep Learning》
 介紹:萊斯大學(xué)(Rice University)的深度學(xué)習(xí)的概率理論.
??? 《Nonsensical beer reviews via Markov chains》
 介紹:基于馬爾可夫鏈自動(dòng)生成啤酒評(píng)論的開源Twitter機(jī)器人,github地址.
??? 《Deep Learning for Natural Language Processing (without Magic)》
 介紹:視頻+講義:深度學(xué)習(xí)用于自然語(yǔ)言處理教程(NAACL13).
??? 《Introduction to Data Analysis using Machine Learning》
 介紹:用機(jī)器學(xué)習(xí)做數(shù)據(jù)分析,David Taylor最近在McGill University研討會(huì)上的報(bào)告,還提供了一系列講機(jī)器學(xué)習(xí)方法的ipn,很有價(jià)值 GitHub.國(guó)內(nèi)
??? 《Beyond Short Snippets: Deep Networks for Video Classification》
 介紹:基于CNN+LSTM的視頻分類,google演示.
??? 《How does Quora use machine learning in 2015?》
 介紹:Quora怎么用機(jī)器學(xué)習(xí).
??? 《Amazon Machine Learning – Make Data-Driven Decisions at Scale》
 介紹:亞馬遜在機(jī)器學(xué)習(xí)上面的一些應(yīng)用,代碼示例.
??? 《Parallel Machine Learning with scikit-learn and IPython》
 介紹:并行機(jī)器學(xué)習(xí)指南(基于scikit-learn和IPython).notebook
??? 《Intro to machine learning with scikit-learn》
 介紹:DataSchool的機(jī)器學(xué)習(xí)基本概念教學(xué).
??? 《DeepCLn》
 介紹:一個(gè)基于OpenGL實(shí)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò),支持Linux及Windows系.
??? 《An Inside Look at the Components of a Recommendation Engine》
 介紹:基于Mahout和Elasticsearch的推薦系統(tǒng).
??? 《Forecasting in Economics, Business, Finance and Beyond》
 介紹:Francis X. Diebold的《(經(jīng)濟(jì)|商業(yè)|金融等領(lǐng)域)預(yù)測(cè)方法.
??? 《Time Series Econometrics - A Concise Course》
 介紹:Francis X. Diebold的《時(shí)序計(jì)量經(jīng)濟(jì)學(xué)》.
??? 《A comparison of open source tools for sentiment analysis》
 介紹:基于Yelp數(shù)據(jù)集的開源情感分析工具比較,評(píng)測(cè)覆蓋Naive Bayes、SentiWordNet、CoreNLP等 .
??? 《Pattern Recognition And Machine Learning》
 介紹:國(guó)內(nèi)Pattern Recognition And Machine Learning讀書會(huì)資源匯總,各章pdf講稿,博客.
??? 《Probabilistic Data Structures for Web Analytics and Data Mining 》
 介紹:用于Web分析和數(shù)據(jù)挖掘的概率數(shù)據(jù)結(jié)構(gòu).
??? 《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》
 介紹:機(jī)器學(xué)習(xí)在導(dǎo)航上面的應(yīng)用.
??? 《Neural Networks Demystified 》
 介紹:Neural Networks Demystified系列視頻,Stephen Welch制作,純手繪風(fēng)格,淺顯易懂,國(guó)內(nèi)云.
??? 《swirl + DataCamp 》
 介紹:{swirl}數(shù)據(jù)訓(xùn)練營(yíng):R&數(shù)據(jù)科學(xué)在線交互教程.
??? 《Learning to Read with Recurrent Neural Networks 》
 介紹:關(guān)于深度學(xué)習(xí)和RNN的討論 Sequence to Sequence Learning with Neural Networks.
??? 《深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的資源》
 介紹:Deep Reinforcement Learning.
??? 《Machine Learning with Scikit-Learn》
 介紹:(PyCon2015)Scikit-Learn機(jī)器學(xué)習(xí)教程,Parallel Machine Learning with scikit-learn and IPython.
??? 《PDNN》
 介紹:PDNN: A Python Toolkit for Deep Learning.
??? 《Introduction to Machine Learning》
 介紹:15年春季學(xué)期CMU的機(jī)器學(xué)習(xí)課程,由Alex Smola主講,提供講義及授課視頻,很不錯(cuò).國(guó)內(nèi)鏡像.
??? 《Big Data Processing》
 介紹:大數(shù)據(jù)處理課.內(nèi)容覆蓋流處理、MapReduce、圖算法等.
??? 《Spark MLlib: Making Practical Machine Learning Easy and Scalable》
 介紹:用Spark MLlib實(shí)現(xiàn)易用可擴(kuò)展的機(jī)器學(xué)習(xí),國(guó)內(nèi)鏡像.
??? 《Picture: A Probabilistic Programming Language for Scene Perception》
 介紹:以往上千行代碼概率編程(語(yǔ)言)實(shí)現(xiàn)只需50行.
??? 《Beautiful plotting in R: A ggplot2 cheatsheet》
 介紹:ggplot2速查小冊(cè)子,另外一個(gè),此外還推薦《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.
??? 《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》
 介紹:用結(jié)構(gòu)化模型來(lái)預(yù)測(cè)實(shí)時(shí)股票行情.
??? 《International Joint Conference on Artificial Intelligence Accepted paper》
 介紹:國(guó)際人工智能聯(lián)合會(huì)議錄取論文列表,大部分論文可使用Google找到.
??? 《Why GEMM is at the heart of deep learning》
 介紹:一般矩陣乘法(GEMM)對(duì)深度學(xué)習(xí)的重要性.
??? 《Distributed (Deep) Machine Learning Common》
 介紹:A Community of awesome Distributed Machine Learning C++ projects.
??? 《Reinforcement Learning: An Introduction》
 介紹:免費(fèi)電子書<強(qiáng)化學(xué)習(xí)介紹>,第一版(1998),第二版(2015草稿),相關(guān)課程資料,Reinforcement Learning.
??? 《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》
 介紹:免費(fèi)書:Azure ML使用精要.
??? 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
 介紹:A Deep Learning Tutorial: From Perceptrons to Deep Networks.
??? 《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》
 介紹:有趣的機(jī)器學(xué)習(xí):最簡(jiǎn)明入門指南,中文版.
??? 《A Brief Overview of Deep Learning》
 介紹:深度學(xué)習(xí)簡(jiǎn)明介紹,中文版.
??? 《Wormhole》
 介紹:Portable, scalable and reliable distributed machine learning.
??? 《convnet-benchmarks》
 介紹:CNN開源實(shí)現(xiàn)橫向評(píng)測(cè),參評(píng)框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表現(xiàn)突出.
??? 《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》
 介紹:卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院語(yǔ)言技術(shù)系的資源大全,包括大量的NLP開源軟件工具包,基礎(chǔ)數(shù)據(jù)集,論文集,數(shù)據(jù)挖掘教程,機(jī)器學(xué)習(xí)資源.
??? 《Sentiment Analysis on Twitter》
 介紹:Twitter情感分析工具SentiTweet,視頻+講義.
??? 《Machine Learning Repository @ Wash U》
 介紹:華盛頓大學(xué)的Machine Learning Paper Repository.
??? 《Machine learning cheat sheet》
資料github地址
part1
part2
part3
 參考文獻(xiàn):http://ask.julyedu.com/article/60
 ---------------------
 作者:zhongwen7710
 原文:https://blog.csdn.net/zhongwen7710/article/details/45331915
總結(jié)
以上是生活随笔為你收集整理的机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: swift UIActivityIn
- 下一篇: 如何快速删除打印机任务
