数据分析的成长规划
數(shù)據(jù)分析師的成長之路
在學(xué)習(xí)數(shù)據(jù)分析之前應(yīng)該明白幾點(diǎn)
數(shù)據(jù)初期的準(zhǔn)備通常占整個(gè)數(shù)據(jù)挖掘項(xiàng)目工作量的70%左右。
數(shù)據(jù)分析師本身融合了業(yè)務(wù)知識(shí)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)等學(xué)科,并不是新的技術(shù)。
數(shù)據(jù)分析更適合業(yè)務(wù)人員學(xué)習(xí)(相比技術(shù)人員學(xué)習(xí)業(yè)務(wù)來的更高效)
數(shù)據(jù)分析項(xiàng)目通常需要重復(fù)一些毫無技術(shù)含量的工作。
以數(shù)據(jù)分析師為例,先看一下國內(nèi)知名互聯(lián)網(wǎng)數(shù)據(jù)分析師的招聘要求:
計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;
具有深厚的統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘知識(shí),熟悉數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的相關(guān)技術(shù),能夠熟練地使用SQL;
三年以上具有海量數(shù)據(jù)挖掘、分析相關(guān)項(xiàng)目實(shí)施的工作經(jīng)驗(yàn),參與過較完整的數(shù)據(jù)采集、整理、分析和建模工作;
對(duì)商業(yè)和業(yè)務(wù)邏輯敏感,熟悉傳統(tǒng)行業(yè)數(shù)據(jù)挖掘背景、了解市場(chǎng)特點(diǎn)及用戶需求,有互聯(lián)網(wǎng)相關(guān)行業(yè)背景,有網(wǎng)站用戶行為研究和文本挖掘經(jīng)驗(yàn)尤佳;
具備良好的邏輯分析能力、組織溝通能力和團(tuán)隊(duì)精神;
富有創(chuàng)新精神,充滿激情,樂于接受挑戰(zhàn)
從業(yè)務(wù)開始
學(xué)習(xí)一門技術(shù)要和行業(yè)靠攏,沒有行業(yè)背景的技術(shù)如空中樓閣。技術(shù)尤其是計(jì)算機(jī)領(lǐng)域的技術(shù)發(fā)展是寬泛且快速更替的(十年前做網(wǎng)頁設(shè)計(jì)都能成立公司),一般人沒有這個(gè)精力和時(shí)間全方位的掌握所有技術(shù)細(xì)節(jié)。但是技術(shù)在結(jié)合行業(yè)之后就能夠獨(dú)當(dāng)一面了,一方面有利于抓住用戶痛點(diǎn)和剛性需求,另一方面能夠累計(jì)行業(yè)經(jīng)驗(yàn),使用互聯(lián)網(wǎng)思維跨界讓你更容易取得成功。不要在學(xué)習(xí)技術(shù)時(shí)想要面面俱到,這樣會(huì)失去你的核心競(jìng)爭(zhēng)力。
大數(shù)據(jù)是技術(shù)工具,最終的應(yīng)用需要深入理解業(yè)務(wù)企業(yè)的業(yè)務(wù)場(chǎng)景和商業(yè)模式,甚至有人說不懂業(yè)務(wù)就不要談大數(shù)據(jù),可見領(lǐng)域知識(shí)的重要性。值得一提的是,近幾年在頂尖科學(xué)雜志《Nature》與《Science》上發(fā)表的大數(shù)據(jù)文章都是來自行業(yè)專家,而并非計(jì)算機(jī)專家,這從另外一個(gè)方面反映了業(yè)務(wù)知識(shí)的重要性。
get技能
數(shù)學(xué)知識(shí)
數(shù)學(xué)知識(shí)是數(shù)據(jù)分析師的基礎(chǔ)知識(shí)。對(duì)于初級(jí)數(shù)據(jù)分析師,了解一些描述統(tǒng)計(jì)相關(guān)的基礎(chǔ)內(nèi)容,有一定的公式計(jì)算能力即可,了解常用統(tǒng)計(jì)模型算法則是加分。對(duì)于高級(jí)數(shù)據(jù)分析師,統(tǒng)計(jì)模型相關(guān)知識(shí)是必備能力,線性代數(shù)(主要是矩陣計(jì)算相關(guān)知識(shí))最好也有一定的了解。
分析工具
對(duì)于初級(jí)數(shù)據(jù)分析師,玩轉(zhuǎn)Excel是必須的,數(shù)據(jù)透視表和公式使用必須熟練,VBA是加分。另外,還要學(xué)會(huì)一個(gè)統(tǒng)計(jì)分析工具,SPSS作為入門是比較好的。對(duì)于高級(jí)數(shù)據(jù)分析師,使用分析工具是核心能力, SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
編程語言
對(duì)于初級(jí)數(shù)據(jù)分析師,會(huì)寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。對(duì)于高級(jí)數(shù)據(jù)分析師,除了SQL以外,學(xué)習(xí)Python是很有必要的,用來獲取和處理數(shù)據(jù)都是事半功倍。當(dāng)然其他編程語言也是可以的。
以上來自:http://www.ppvke.com/Blog/archives/37780
做了一段時(shí)間的數(shù)據(jù)分析,一點(diǎn)個(gè)人的體會(huì):
1、數(shù)據(jù)的前期準(zhǔn)備非常重要,首先你需要特別了解你的數(shù)據(jù),內(nèi)容是什么,各類數(shù)據(jù)的范圍,大致特征;然后進(jìn)行數(shù)據(jù)清洗和預(yù)處理,這些都是非常關(guān)鍵的步驟。
如果忽略以上的步驟或者完成的不到位,那么即使是在最后的建模階段,撰寫分析報(bào)告的階段,也都得回到最初的數(shù)據(jù)準(zhǔn)備環(huán)節(jié)。
2、要熟練掌握常用的統(tǒng)計(jì)軟件,比如Excel,spss等,有時(shí)候如果對(duì)編程不熟悉的部分直接使用統(tǒng)計(jì)分析軟件,結(jié)果會(huì)更快和更方便。
在工作中,一方面要求效率,一方面要求準(zhǔn)確性和數(shù)據(jù)的可用性,所以,有時(shí)候必須得充分考慮數(shù)據(jù)的特點(diǎn)和實(shí)際問題的結(jié)合,才能得出具有實(shí)用性的分析結(jié)果。
3、 學(xué)習(xí)的系統(tǒng)性
這一點(diǎn)非常重要,現(xiàn)在處于一個(gè)碎片化知識(shí)的整理和部分的加強(qiáng)階段。
4、習(xí)慣記錄!
學(xué)習(xí)的記錄是一個(gè)非常重要的環(huán)節(jié),一方面是知識(shí)的鞏固,更重要的是一個(gè)邏輯的強(qiáng)化。
keep updating!
總結(jié)
- 上一篇: 谷歌插件 Web前端助手(FeHelp
- 下一篇: 将读写锁放到共享内存,实现进程之间对于同