10 本大数据高分书籍,收好给头脑充充电吧~
導(dǎo)語(yǔ):機(jī)器學(xué)習(xí)和數(shù)據(jù)分析密不可分,除了網(wǎng)課,我相信一些優(yōu)質(zhì)圖書(shū)肯定能幫到你的忙,今天推薦10本技術(shù)圖書(shū),都是非常實(shí)用且有幫助的,多讀讀多看看,肯定獲益匪淺。
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析是一對(duì)復(fù)雜且相互關(guān)聯(lián)的概念。為了跟上潮流,你需要做足準(zhǔn)備,花時(shí)間研究并且更新知識(shí)。即使日復(fù)一日地在這個(gè)行業(yè)工作,仍然有可能落后于當(dāng)前的趨勢(shì)。
為了不落人后,最好的方式是繼續(xù)刷新自己的知識(shí),同時(shí)保持上手的經(jīng)驗(yàn)。在這行業(yè)中要取得成功,需要完美的項(xiàng)目經(jīng)驗(yàn)和技能組合。盡管網(wǎng)上有大量的資源,我們?nèi)砸獙iT(mén)推薦一些好的實(shí)體書(shū)籍。
1. 《Machine Learning Yearning》 by 吳恩達(dá)
由現(xiàn)代數(shù)據(jù),大數(shù)據(jù)和數(shù)據(jù)科學(xué)開(kāi)發(fā)并生產(chǎn)出的機(jī)器學(xué)習(xí)系統(tǒng)已經(jīng)不是什么秘密。雖然它們不一定是同義詞,但卻是互相關(guān)聯(lián)的,因此如果你在數(shù)據(jù)行業(yè)工作,那么提高對(duì)機(jī)器學(xué)習(xí)的理解和認(rèn)識(shí)是個(gè)不錯(cuò)的想法。
從本書(shū)中你可以學(xué)到一些洞察能力,例如你應(yīng)該多長(zhǎng)時(shí)間收集一次訓(xùn)練數(shù)據(jù)集,如何使用端到端的深度學(xué)習(xí),以及如何利用你正在創(chuàng)建的系統(tǒng)來(lái)共享數(shù)據(jù)和統(tǒng)計(jì)信息。
2. 《Hadoop:權(quán)威指南》 by Tom White
Apache Hadoop是用于處理和管理大量數(shù)據(jù)的主要框架。任何從事編程或數(shù)據(jù)科學(xué)工作的人都有必要熟悉這個(gè)平臺(tái)。事實(shí)上,這是開(kāi)發(fā)可擴(kuò)展系統(tǒng)最有效的方法之一。
身為Hadoop顧問(wèn)和Apache軟件基金會(huì)成員的Tom White寫(xiě)了這本標(biāo)準(zhǔn)指南,其中包羅作者的個(gè)人見(jiàn)解和一些有用的資源。更重要的是,它將引導(dǎo)你完成Hadoop的設(shè)置并且過(guò)一遍整體流程。
Apache Spark是你可能需要花時(shí)間學(xué)習(xí)的另一個(gè)重要平臺(tái)。
3.《預(yù)測(cè)分析》 by Eric Siegel
本書(shū)詳細(xì)解釋了如何獲取多種形式的數(shù)據(jù)和信息,并將其轉(zhuǎn)化為可實(shí)施的預(yù)測(cè)或見(jiàn)解的方法。本書(shū)的核心目的是幫助專業(yè)人員更好地了解他們的受眾。你將學(xué)會(huì)如何識(shí)別他們購(gòu)買(mǎi)的產(chǎn)品和服務(wù),訪問(wèn)的地點(diǎn),與他們產(chǎn)生共鳴的內(nèi)容等等。
眾所周知,數(shù)據(jù)科學(xué)家的工作是查看未經(jīng)過(guò)濾的原始數(shù)據(jù),并發(fā)現(xiàn)可用的趨勢(shì)和模式。本書(shū)不僅可以幫助你做到這一點(diǎn),而且還提出必要的預(yù)測(cè)算法來(lái)改進(jìn)未來(lái)的操作和流程。本書(shū)可以算是預(yù)測(cè)分析的圣經(jīng)。
4. 《用數(shù)據(jù)講故事》 by Kole Nussbaumer Knaflic
《用數(shù)據(jù)講故事:商業(yè)專業(yè)人士的數(shù)據(jù)可視化指南》 是業(yè)內(nèi)的重要讀物,甚至對(duì)與商業(yè)不怎么相關(guān)的人士也極為重要。為什么呢?
簡(jiǎn)而言之,本書(shū)涉及大量數(shù)據(jù)的管理和提取工作。其中包含:去除過(guò)多且不明確的數(shù)據(jù),改進(jìn)數(shù)據(jù)收集流程,并產(chǎn)出相關(guān)且實(shí)際的數(shù)據(jù)可視化結(jié)果。
這是一本權(quán)威指南,旨在幫助你了解應(yīng)該如何處理收集到所有有用的數(shù)據(jù),以及如何實(shí)際去做的方式。許多見(jiàn)解適用于科技產(chǎn)業(yè),但對(duì)于非科技領(lǐng)域的專業(yè)人員同樣適用。
5. 《大拐點(diǎn)》 by? Scott Stawski
本書(shū)對(duì)于了解當(dāng)前數(shù)據(jù)分析和云計(jì)算行業(yè)的發(fā)展勢(shì)頭十分有幫助。特別值得注意的是,Stawski主要關(guān)注原始數(shù)據(jù)存儲(chǔ)和挖掘系統(tǒng)、如何部署以及在現(xiàn)實(shí)世界中的使用情況。
它不僅是一個(gè)理論指南,還揭示了實(shí)際的工作系統(tǒng),并且提到如何把相應(yīng)模式套用到你的企業(yè)或公司。更重要的一點(diǎn)是,你可以從本書(shū)中清楚了解如何在組織內(nèi)部署這些工具和平臺(tái)。
6. 《統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論·基于R應(yīng)用》? by Gareth James等人
統(tǒng)計(jì)學(xué)習(xí)和相關(guān)的方法是數(shù)據(jù)科學(xué)工作所必需的概念。這本教科書(shū)旨在幫助每個(gè)人——從本科到博士,了解這些統(tǒng)計(jì)概念。
當(dāng)然,它也提供了一些很好的R-lab與練習(xí),其中有詳細(xì)的解釋和攻略。你可以在學(xué)習(xí)階段直接用它來(lái)練習(xí)數(shù)據(jù)科學(xué)。他還能在你的日常應(yīng)用中作為工具書(shū)反復(fù)查閱。
7. 《商業(yè)中的數(shù)據(jù)分析》 by Foster Provost, Tom Fawcett
本書(shū)由著名數(shù)據(jù)科學(xué)專家Foster Provost和Tom Fawcett撰寫(xiě),介紹了數(shù)據(jù)科學(xué)的基本原理,讓你從收集的數(shù)據(jù)中提取有用的知識(shí)和業(yè)務(wù)價(jià)值所需的“數(shù)據(jù)分析思維”,并可幫助你了解當(dāng)今使用的許多數(shù)據(jù)挖掘技術(shù)。
這本書(shū)有趣的地方,是會(huì)特別標(biāo)記出較困難的技術(shù)部分,并深入淺出的介紹數(shù)據(jù)挖掘中的重要的幾個(gè)概念:分類,聚類和回歸。更重要的是書(shū)中包含了這些概念在商務(wù)上的的直接應(yīng)用。
8. 《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》 by Cathy O'Neil, Rachel Schutt
這本以哥倫比亞大學(xué)的數(shù)據(jù)科學(xué)入門(mén)課為基礎(chǔ),包含了Google,Microsoft和eBay等公司的數(shù)據(jù)科學(xué)家的經(jīng)驗(yàn),通過(guò)介紹案例研究和他們使用的代碼的經(jīng)歷,分享了新的算法,方法和模型。
如果你熟悉線性代數(shù),概率和統(tǒng)計(jì),并具有編程經(jīng)驗(yàn),本書(shū)是你對(duì)數(shù)據(jù)科學(xué)的理想介紹。主題包括:統(tǒng)計(jì)推斷、探索性數(shù)據(jù)分析和數(shù)據(jù)科學(xué)過(guò)程算法、垃圾郵件過(guò)濾器、樸素貝葉斯和數(shù)據(jù)處理邏輯回歸、財(cái)務(wù)建模、推薦引擎和因果關(guān)系數(shù)據(jù)可視化、社交網(wǎng)絡(luò)和數(shù)據(jù)新聞、數(shù)據(jù)工程、MapReduce。
9. 《Show Me the Numbers》 by Stephen Few
在BI產(chǎn)業(yè)有30多年的經(jīng)驗(yàn)之后,Stephen Few并不針對(duì)哪一種可視化工具進(jìn)行鉆研,而是從更高層次的去討論,什么圖形該怎么使用,來(lái)傳達(dá)什么樣的訊息是最有效的,以及數(shù)據(jù)分析產(chǎn)業(yè)的發(fā)展與趨勢(shì)。
這本書(shū)中,他介紹了可視化的起源和背后的應(yīng)用,為讀者提供實(shí)際的設(shè)計(jì)指導(dǎo),針對(duì)不同數(shù)據(jù)使用者的不同使用場(chǎng)景給出建議,在一些現(xiàn)在流行卻有潛在問(wèn)題的可視化設(shè)計(jì)上做出改進(jìn)。
10. 《精益數(shù)據(jù)分析》 by Alistair Croll / Benjamin Yoskovitz
本書(shū)延續(xù)了新創(chuàng)企業(yè)文化中MVP(Most Valuable Product)概念和商業(yè)畫(huà)布架構(gòu),展示了如何利用數(shù)據(jù)的方式,分析六個(gè)產(chǎn)業(yè)中(電子商務(wù)、SaaS、免費(fèi)移動(dòng)應(yīng)用、媒體網(wǎng)站、用戶生成內(nèi)容與雙邊市場(chǎng))的數(shù)據(jù),驗(yàn)證創(chuàng)業(yè)者自己的設(shè)想、找到真正的客戶、打造能賺錢(qián)的產(chǎn)品,以及提升企業(yè)知名度。
有趣的地方是,就算新創(chuàng)企業(yè)的數(shù)據(jù)沒(méi)有成熟企業(yè)來(lái)的多,作者認(rèn)為每種不同的產(chǎn)業(yè)仍有必須關(guān)注的指標(biāo)數(shù)字。根據(jù)這些數(shù)字新創(chuàng)公司可以更有效的管理和拓展生意。
來(lái)源:優(yōu)達(dá)學(xué)城Udacity
精彩活動(dòng)
福利 · 閱讀 | 免費(fèi)申請(qǐng)讀大數(shù)據(jù)新書(shū) 第23期
推薦閱讀
2017年數(shù)據(jù)可視化的七大趨勢(shì)!?
全球100款大數(shù)據(jù)工具匯總(前50款)?
論大數(shù)據(jù)的十大局限
大數(shù)據(jù)時(shí)代的10個(gè)重大變革
大數(shù)據(jù)七大趨勢(shì) 第一個(gè)趨勢(shì)是物聯(lián)網(wǎng)
Q:?你還看過(guò)哪些大數(shù)據(jù)圖書(shū)值得推薦?
歡迎留言與大家分享
請(qǐng)把這篇文章分享給你的朋友
轉(zhuǎn)載 / 投稿請(qǐng)聯(lián)系:hzzy@hzbook.com
更多精彩文章,請(qǐng)?jiān)诠娞?hào)后臺(tái)點(diǎn)擊“歷史文章”查看
總結(jié)
以上是生活随笔為你收集整理的10 本大数据高分书籍,收好给头脑充充电吧~的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Simulink之门极关断晶闸管(GTO
- 下一篇: 985毕业+数据分析师+做过名企项目+懂