Spark学习入门
寫給自己的話:
對于大數(shù)據(jù)開發(fā)的工作要求,spark隨時可見。所以要下定決心好好看一看spark相關(guān)的技術(shù)。
學(xué)習(xí)目錄:
第一步是配置spark環(huán)境:包括linux系統(tǒng)的安裝,java,ssh,Hadoop,Scala,spark的安裝與環(huán)境變量設(shè)置。
第二步:java學(xué)習(xí)。
第三步:Hadoop學(xué)習(xí)。HDFS,MR計算框架,必須得知道吧。spark也是需要在HDFS上進(jìn)行數(shù)據(jù)獲取的,學(xué)習(xí)Hadoop才能知道其不足,明白spark的優(yōu)勢,為什么Hadoop必死。在hdfs的操作指令也必須掌握。能會寫MapReduce程序就再好不過了。 第四步:Scala學(xué)習(xí)。函數(shù)式編程,重點(diǎn)明白這個吧。只需能看懂,而且會使用Scala操作RDD就行。 第五步:就是spark學(xué)習(xí)。當(dāng)然,最好學(xué)習(xí)spark的方式就是看官方文檔,讀源碼,看博客(博客寫的都太簡單,沒有特別深入的),看RDD的論文,作業(yè)如何調(diào)度,某研究院的spark官方文檔中文翻譯https://www.cnblogs.com/BYRans/p/5057110.html 學(xué)習(xí)渠道:- 官網(wǎng)的編程手冊
- 只有實(shí)際項(xiàng)目才能從本質(zhì)上提升一個人的spark能力
?
轉(zhuǎn)載于:https://www.cnblogs.com/ljangle/p/10436663.html
總結(jié)
- 上一篇: 没有基础,想学肚皮舞,费用贵吗?
- 下一篇: 天然淡水珍珠有灰色的吗