如何12个月内成为数据科学家?
RoyalMail數(shù)據(jù)科學家Freddie Odukomaiya曾經(jīng)用12個月的時間讓自己成功的成為數(shù)據(jù)科學家,以下是他的經(jīng)驗分享和他所使用的學習資源。
以下內容譯自https://blog.usejournal.com/how-to-become-a-data-scientist-in-12-months-71aa9ee822d9
?
想成為數(shù)據(jù)科學家,以下8點非常重要
- 選擇一種編程語言,堅持下去。
不要不斷改變你選擇的語言。如果這樣做,你的進度將大大減慢。
- 明確你的動機。
這很重要,因為學習數(shù)據(jù)科學很難,所以在過程中很容易失去動力。如果你的動力清晰而強大,那么就更容易忍受和堅持。
- 不要迷失在課程中。
如果你只是不斷的在學習教程,你很容易陷入一種自我欺騙“我知道自己在干什么”。最好的方法是在項目中學習。找一個你感興趣的項目,把數(shù)據(jù)科學應用其中,比如,我的項目是預測英超聯(lián)賽的冠軍。
- 精準選擇小部分資源。
現(xiàn)在有太多學習數(shù)據(jù)科學基礎知識的資源。一個普遍的現(xiàn)象是,大家很難堅持使用一個資源學習,很多人使用一個資源開始學習,看到了一個更好的資源后立即就更換了學習資源,這樣成本是非常高的,要盡量避免這種情況。相反,我們應該選擇一組涵蓋不同主題的資源(例如,construct a curriculum),堅持下去,知道你完成他們
- 讓自己沉浸在社區(qū)中。
你需要讓數(shù)據(jù)科學包圍自己。可以通過以下幾種方式:訂閱DS簡報,閱讀數(shù)據(jù)科學文章和書籍,收聽數(shù)據(jù)科學播客,在youtube上觀看數(shù)據(jù)科學講座,通過參加所有和任何數(shù)據(jù)科學活動,利用Meetup和Eventbrite等網(wǎng)站。查找在線DS社區(qū)并加入他們。
- 去黑客馬拉松!
不要等到你“準備好”再去參加黑客馬拉松,參加黑客馬拉松的好處遠遠超過你認為你會經(jīng)歷的任何負面影響。黑客馬拉松也可以在線參與,例如,Kaggle本質上就是一個永無止境的在線黑客馬拉松。
- 尋找導師。
這對我來說是最困難的部分,因為我對導師的定義有些許誤解。導師只是一位經(jīng)驗豐富且值得信賴的老師/輔導員。你可以擁有多個導師,甚至可能無法直接與他們互動。我最終的導師其實是哪些有影響力的數(shù)據(jù)科學家,我通過社交媒體關注他們,訂閱他們的新聞通訊,閱讀他們的書籍和聽他們的談話/播客。當我覺得我需要建議時,我通過電子郵件和社交媒體與他們聯(lián)系,雖然不是每個人都回復了我,但那些確實幫助了我很多。
- 準備好犧牲你工作日的晚上和周末。
你必須投入大量的精修勤練,花費大量時間學習,你的社交生活會受到影響。努力工作很重要,但聰明地工作更有價值,請你準備一份時間表,關于你正在學習的課程,正在閱讀的書籍以及正在開展的項目。
最全學習資源匯總
充分利用這些信息資源才能更好的學習數(shù)據(jù)科學哦。
【課程】
- 開源數(shù)據(jù)科學大師 ?- @clarecorthell制作了涵蓋數(shù)據(jù)科學所有不同方面的課程,并附有相關課程,書籍等的鏈接。
- Class Central ?- 這是谷歌的在線課程。您可以通過簡介和用戶評分找到與任何主題相關的在線課程。
- DataCamp ?- 一家通過互動在線課程教授數(shù)據(jù)科學的EdTech公司。
【實踐】
- Kaggle ?- Kaggle是預測建模和分析競賽的平臺。
- #100DaysOfCode ?- 這是一個挑戰(zhàn),初學者嘗試每天至少編碼一個小時,持續(xù)100天。
- Codewars ?- 通過與其他人一起訓練真實代碼的挑戰(zhàn)來提高您的技能。
- DrivenData ?- DrivenData讓眾包成為世上最大的社會挑戰(zhàn)和組織之一。
- HackerRank ?- 練習編碼。參與競爭。找工作。
【書籍】
- Machine Learning with Python Cookbook by Chris Albon
- An Introduction to Statistical Learning: with Applications in R
- Hands-On Machine Learning with Scikit-Learn and TensorFlow by Aurélien Géron
- Think Stats: Exploratory Data Analysis by by Allen B. Downey
- The Signal and the Noise: The Art and Science of Prediction by Nate Silver
- Prediction Machines: The Simple Economics of Artificial Intelligence
- How to Lie with Statistics by Darrell Huff
- Automate the Boring Stuff with Python by Al Sweigart
【通訊/博客】
- Data Elixir?— Data Elixir每周二會發(fā)送到您的收件箱,其中包含從網(wǎng)絡上挑選的數(shù)據(jù)科學內容。
- Data Science Roundup?- 互聯(lián)網(wǎng)上最有用的數(shù)據(jù)科學文章。由Tristan Handy策劃。
- FiveThirtyEight ?- Nate Silver使用統(tǒng)計分析來解決政治和體育問題的熱門博客。
- Variance Explained ?- David Robinson的數(shù)據(jù)科學博客,DataCamp的首席數(shù)據(jù)科學家,這是一家通過互動在線課程教授數(shù)據(jù)科學的EdTech公司。
- Flowing Data ?- FlowingData探索統(tǒng)計學家,設計師,數(shù)據(jù)科學家和其他人如何使用分析、可視化和探索去理解數(shù)據(jù)和我們自己。
- The Pudding ?- ?The Pudding通過視覺論文解釋了文化中爭論的觀點
- Datacamp ?- 幫助您成為數(shù)據(jù)科學家的數(shù)據(jù)科學博客。
- Kaggle Blog ?- Kaggle.com的官方博客
- Machine Learning Mastery ?- 即使你是從0開始,也可以在真實應用程序中使用它來掌握機器學習。
- Chris Albon ?- 流行的Machine Learning Flashcards背后的數(shù)據(jù)科學家和Machine Learning with Python Cookbook的作者。
- KD Nuggets ?- KDnuggets?是業(yè)務分析,大數(shù)據(jù),數(shù)據(jù)挖掘,數(shù)據(jù)科學和機器學習的領先站點。
- Analytics Vidhya ?- 了解有關Data Analytics的所有信息。
【播客】
- Linear Digressions ?- 在每一集中,主持人通過有趣的應用程序探索機器學習和數(shù)據(jù)科學。
- Partially Derivative ?- 日常生活中每天的數(shù)據(jù),由Data Science超級極客主持。
- Data Skeptic ?- 介紹與數(shù)據(jù)科學,機器學習,統(tǒng)計和人工智能相關的主題的訪談和教育討論。
- This Week In Machine Learning and Artificial Intelligence- 迎合熱愛機器學習的觀眾和AI愛好者。
- Software Engineering Daily ?- 關于軟件主題的技術訪談。
- DataFramed ?- 通過DataCamp,專注于探索數(shù)據(jù)科學可以解決的問題。
- Talking Machines ?- 機器學習正在改變我們可以提出的問題,我們探索如何提出最佳問題以及如何解決問題。
- Becoming A Data Scientist Podcast ?- 訪問數(shù)據(jù)科學家,了解他們成功的方法。
- AI in Industry- 每周Dan Faggella都會采訪Top AI和ML高管,投資者和研究人員。
【Youtube頻道】
- 3Blue1Brown ?- 到目前為止最好的數(shù)學教程頻道。以可視方式解釋復雜概念。
- Brandon Foltz ?- 我第二喜歡的數(shù)學頻道,主要側重于從初級到高級教學統(tǒng)計。
- Computerphile ?- 關于計算機和計算機的視頻。
- PyData ?- PyData為數(shù)據(jù)分析工具的用戶和開發(fā)人員的國際社區(qū)提供了一個論壇,分享想法,相互學習。
- Sentdex ?- Youtuber和程序員會提供高質量的數(shù)據(jù)科學教程。
- Siraj Raval ?- 與Sentdex類似,可生成有趣且信息豐富的數(shù)據(jù)科學內容。
- 兩分鐘論文 ?- 在2分鐘內解釋最新的數(shù)據(jù)科學研究論文。
- Enthought ?- 從SciPy等流行的數(shù)據(jù)科學會議中尋找精彩的對話和討論。
【大家要關注】
- @BecomingDataSci ?- HelioCampus的數(shù)據(jù)科學家Renee Teate和流行的Becoming A Data Scientist網(wǎng)站和播客的創(chuàng)建者。
- @drob ?- 大衛(wèi)羅賓遜,DataCamp的首席數(shù)據(jù)科學家,Tidytext軟件包和O'Reilly的書籍Text Mining with R的共同作者。
- @chrisalbon ?- Chris Albon,流行的Machine Learning Flashcards背后的數(shù)據(jù)科學家和Machine Learning with Python Cookbook的作者。
- @frankchn ?- Frank Chen,Google Brain的軟件工程師,負責TensorFlow。
- @fchollet ?- Francois Chollet,Google的深度學習。神經(jīng)網(wǎng)絡庫Keras的創(chuàng)造者。“Deep Learning with Python”的作者。
- @goodfellow_ian ?-Ian Goodfellow,Google腦研究科學家,領導一個研究人工智能對抗技術的團隊。Deep Learning Book的主要作者。
- @jakevdp ?- Jake VanderPlas,華盛頓大學電子科學研究所數(shù)據(jù)科學家。訪問Google的研究員; Python Data Science Handbook的作者。
- @dataandme ?- 來自Rstudio的Tidyverse Dev Advocate的Mera Averick。
- @math_rachel ?- Rachel Thomas,Fast.ai的聯(lián)合創(chuàng)始人和舊金山大學教授。
【在線社區(qū)】
- Python for Data Science
- FreeCodeCamp Data Science Room
- Reddit's Data Science Subreddit
- Kaggle’s online forum
- #100DaysOfCode ?- #100DaysOfCode Challenge參與者的Slack頻道。
- Stack Overflow ?- 全球最大的開發(fā)者社區(qū)。
?
數(shù)據(jù)科學的學習是一個永無止境的過程,有了方法和學習資源最重要的一定還是堅持。
享受學習,享受知識,享受進步,大家加油鴨!!
?
網(wǎng)易云信,你身邊的即時通訊和音視頻技術專家,了解我們,請戳網(wǎng)易云信官網(wǎng)
想要行業(yè)洞察和技術干貨,請關注網(wǎng)易云信博客
更多精彩內容,關注網(wǎng)易云信知乎機構號哦。
總結
以上是生活随笔為你收集整理的如何12个月内成为数据科学家?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 浅析为何使用融合CDN是大趋势?
- 下一篇: HTTP/3 来啦,你还在等什么?赶紧了