十大数据爱好者必备书籍
十大數(shù)據(jù)愛好者必備書籍
轉(zhuǎn)載請注明!
這是一個獨一無二的書籍前十推薦,對每個十大推薦展示出頂級付費或免費書籍推薦.如果你對數(shù)據(jù)書籍感興趣,這個列表可能合你口味.
Matthew Mayo 發(fā)表于 KDnuggets.
真正的數(shù)據(jù)愛好者閱讀許多關(guān)于大數(shù)據(jù),機器學(xué)習(xí),數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘的書籍.除了這些技術(shù)領(lǐng)域,還有很多具體語言實現(xiàn):Hadoop,Spark,Python,R等等,更不用說職業(yè)生活各個方面自動化的多種工具.有不少話題需要及時了解.幸運的是(不幸?)這些學(xué)科不缺乏可用的書籍.
有很多數(shù)據(jù)相關(guān)類別的暢銷書名單.實際上KDnuggets 整理過數(shù)據(jù)挖掘,數(shù)據(jù)庫和大數(shù)據(jù),統(tǒng)計,AI和人工智能和神經(jīng)網(wǎng)絡(luò)的相關(guān)名單.但這些都是基于亞馬遜狹義分類的暢銷書名單,沒有考慮免費的書籍.
首先,這個帖子的標題有誤導(dǎo)之嫌.這個廣泛的必備書籍列表為數(shù)據(jù)愛好者(或從業(yè)者)推薦暢銷付費或免費的資源.雖然我們可能從事或其他方式涉及數(shù)量有限的數(shù)據(jù),我們趨向于對這些數(shù)據(jù)有更好的理解.
因此,Hadoop的專家可能不需要專家級別的深度學(xué)習(xí)見解,他們對這一主題的興趣較為短暫.本文是為了鞏固興趣,同時為希望擴大知識范圍的數(shù)據(jù)愛好者提供材料建議.
請記住,在許多類別中,有些是重復(fù)的.通常材料焦點決定分類,而不是材料本身.
數(shù)據(jù)科學(xué)
暢銷付費推薦: Data Science for Business
當時圖了解一個新的領(lǐng)域,最常見的困難是尋找適當深度的書籍(資料).不是簡單無用,就是繁重的學(xué)術(shù)書籍盡管權(quán)威并且全面,但注定無人問津.”Data Science for Business”恰到好處.
- m l, Amazon Review.
暢銷免費推薦:The Art of Data Science
這本書簡單,概括的描述了分析數(shù)據(jù)過程.作者有豐富的管理數(shù)據(jù)分析師和數(shù)據(jù)分析的經(jīng)驗,這本書是他經(jīng)驗的精華,適合于數(shù)據(jù)科學(xué)從業(yè)者和管理者.
- Official Website
大數(shù)據(jù)
暢銷付費推薦:Big Data: Principles and Best Practices of Scalable Realtime Data Systems
我很少看到大數(shù)據(jù)背景下有關(guān)于數(shù)據(jù)建模,數(shù)據(jù)層,數(shù)據(jù)處理需求分析,數(shù)據(jù)架構(gòu)和存儲問題(伴隨傳統(tǒng)數(shù)據(jù)庫的概念)實現(xiàn)重要性的討論.這本書提供了令人耳目一新的全面解決方案.
- Kirk D. Borne, Amazon Review
暢銷面費推薦: Big Data Now: 2015 Edition
四年內(nèi)O’Reilly已經(jīng)提供了年度Big Data Now報告,數(shù)據(jù)領(lǐng)域已經(jīng)從嬰兒時期成長到青少年時期.在某些領(lǐng)域數(shù)據(jù)是領(lǐng)導(dǎo)者,并驅(qū)動創(chuàng)新,而且使用數(shù)據(jù)和分析來驅(qū)動決策的公司都跑贏同行.
- Official Website
Apache Hadoop
暢銷付費推薦: Hadoop: The Definitive Guide
我很欣賞這本書,涵蓋高層次概念,和設(shè)計,實現(xiàn)和日常運行Hadoop我們需要了解的技術(shù)細節(jié),以及各種相關(guān)技術(shù).
- Al Gordon, Amazon Review
暢銷免費推薦:Hadoop Explained
Hadoop是世界上建立于數(shù)據(jù)最重要的技術(shù)之一。了解它如何發(fā)展和進步,以這個見地指南解決大數(shù)據(jù)的持續(xù)挑戰(zhàn)。
- Official Website
Apache Spark
暢銷付費推薦:Learning Spark
互聯(lián)網(wǎng)上可用信息是偉大的,但是這本書將這些結(jié)合到一起。如果您想像Spark程序員一樣思考 - 不是完全像一個程序員 - 這是開始的地方。
- Brian Castelli, Amazon Review
暢銷免費推薦:Mastering Apache Spark
這個筆記的Spark使用過程中所有具體細節(jié)的集合.筆記旨在幫我們用Spark設(shè)計開發(fā)更好的產(chǎn)品.
- Official Website
機器學(xué)習(xí)理論
暢銷付費推薦: Pattern Recognition and Machine Learning
作者是一個專家,他給出機器學(xué)習(xí)算法背后復(fù)雜的數(shù)學(xué)證明.我從事神經(jīng)網(wǎng)絡(luò)方面工作相當長一段時間,教授線性代數(shù),概率與回歸分析課程,并從這本書安靜的啟發(fā)中發(fā)現(xiàn)了一些東西。
- Sidhant, Amazon Review
暢銷免費推薦:Elements of Statistical Learning
好消息是,這是相當最重要的一本書。它將所有東西連接到一起,在其他書中我從未發(fā)現(xiàn)。
- Enceladus Transit, Amazon Review
機器學(xué)習(xí)實踐
暢銷付費推薦: Python Machine Learning
這是一個奇妙的書,即使是對像我這樣的機器學(xué)習(xí)初學(xué)者??赐赀@本書后,想到的第一件事是,完美的融合(至少對我來說)了理論和實踐,以及廣度和深度。
- Brian M. Thomas, Amazon Review
暢銷免費推薦:An Introduction to Statistical Learning with Applications in R
這本書介紹了統(tǒng)計學(xué)習(xí)方法。其目的是為在非數(shù)學(xué)科學(xué)高年紀本科生,碩士研究生和博士學(xué)生。書中還包含了許多R包的詳細解釋,比如如何實現(xiàn)在現(xiàn)實生活中設(shè)置的各種方法,和對實踐數(shù)據(jù)科學(xué)家應(yīng)該是一個寶貴資源。
- Official Website
深度學(xué)習(xí)
由于付費深學(xué)習(xí)書籍的選擇是目前較少,這里有兩個免費選擇。
暢銷免費推薦:Neural Networks and Deep Learning
神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)是一個免費的在線圖書。這本書將教你:
神經(jīng)網(wǎng)絡(luò),確保計算機從觀測數(shù)據(jù)學(xué)習(xí)
深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中一套強大的技術(shù)
- Official Website
暢銷免費推薦:Deep Learning
在準備中,可能在不久的將來稱為深度學(xué)習(xí)書的權(quán)威,作者 Ian Goodfellow, Yoshua Bengio, and Aaron Courville。開發(fā)版本每月更新,并且將免費提供,直到發(fā)布。
數(shù)據(jù)挖掘
暢銷付費推薦:Data Mining: Concepts and Techniques, Third Edition
數(shù)據(jù)挖掘領(lǐng)域的全面概述,我認為這是研究生最好的數(shù)據(jù)挖掘參考用書。這本書的重點是技術(shù)(即,如何分析數(shù)據(jù),包括準備),它解決了所有領(lǐng)域的主要問題,包括數(shù)據(jù)存儲和預(yù)處理。然而,這本書是真正關(guān)心的分類方法,并在聚類分析的第二章講述特別徹底。
- Susan Katz, Amazon Review
暢銷免費推薦: Mining of Massive Datasets
這本書被設(shè)計為在未受過正規(guī)前提條件教育的本科計算機科學(xué)水平。為了支持更深入的探索,大多數(shù)章節(jié)都輔以進一步的閱讀參考。
- Official Website
SQL
暢銷付費推薦: Learning SQL, Second Edition
如果你正在編寫任何類型的數(shù)據(jù)庫驅(qū)動代碼,或者你認為你不需要了解SQL,讀這本書。你需要了解它,這本書教得很好。
- Jack D. Herrington, Amazon Review
暢銷免費推薦:Learn SQL The Hard Way
這本書將教你SQL的80%,你可能需要有效地使用它,同時將概念混合到數(shù)據(jù)建模。如果你已經(jīng)摸索構(gòu)建Web,桌面或移動應(yīng)用程序,因為你不知道SQL,那么這本書適合你。這是為沒有數(shù)據(jù)庫,編程或SQL知識的人寫的,但我們知道至少有一個編程語言會有所幫助。
- Official Website
數(shù)據(jù)科學(xué)統(tǒng)計
暢銷付費推薦: Statistics in Plain English, Third Edition
我作為一個數(shù)據(jù)分析員,每天處理基本數(shù)據(jù)統(tǒng)計。我希望知道所有的模型和算法。雖然統(tǒng)計軟件處理了所有問題,搞清楚軟件設(shè)置的參數(shù)成為棘手的問題。我的專業(yè)是生物技術(shù),對于數(shù)據(jù)統(tǒng)計是陌生的。長話短說,我需要一個堅實的基礎(chǔ)指南,這將有助于我適應(yīng)統(tǒng)計的概念。
- Shyam Goli, Amazon Review
暢銷免費推薦: Think Stats: Probability and Statistics for Programmers, Second Edition
想想統(tǒng)計強調(diào)用來探索真實數(shù)據(jù)集并回答有趣的問題的簡單技術(shù)。這本書以美國國立衛(wèi)生研究院的數(shù)據(jù)為例。我們鼓勵讀者處理真實數(shù)據(jù)集的項目。
- Official Website
總結(jié)
以上是生活随笔為你收集整理的十大数据爱好者必备书籍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Kitty中的动态线程池支持Nacos,
- 下一篇: uniapp 文本 字体 样式总结