成为一名优秀数据分析师的必经之路
在招聘網站上查看大廠數據分析師的任職要求,無一例外提出了需要掌握數據分析的工具,可見在成長的初期,避開分析工具的學習是不可能的。
將這些公司的需求整合一下,不難看出,在零基礎的情況下,需要在成長的初期快速掌握的工具主要是SQL、EXCEL以及Python。
分析工具的學習建議:
1.Excel
會用Excel是最基本的能力,在工作中Excel的使用頻率也很高,Excel的學習也比較簡單,集中學習幾天就能完成。由于Excel的功能非常多,逐個學習是沒有必要的,主要需要掌握的是vlookup等函數、透視表及常用圖表。
2.SQL
如果對SQL語言是完全的新手,不知道增刪查改等基本操作,建議先去看看視頻講解:
《MySQL_基礎+高級篇- 數據庫 -sql
-mysql教程_mysql視頻_mysql入門_尚硅谷》B站播放400W+
掌握SQL基礎后,就要通過刷題反復訓練,直到對這些SQL的命令和語法都了如指掌。專門刷題的網站有:牛客網,采用的是employees數據庫,共61道練習題;LeetCode,上面的題比較考驗邏輯,技巧性高,不過一些題庫需要付費解鎖。
3.Python
市場上的Python課程多如牛毛,但做數據分析需要用到的Python知識并不繁多,我們需要知道的是數據分析崗真正需要用到的Python知識點有哪些?以及數據分析最主要的Python工具庫有哪些?
運用Python做數據分析的人也很多,需要用到的知識主要是數據類型和結構、變量、函數、邏輯語句、匿名函數、錯誤處理、遍歷和迭代、進程和線程、庫的使用;用到的第三方數據分析庫主要有numpy、pandas、matplotlib、scikit-learn(機器學習庫,可以對數據進行分類、回歸、降維、預處理等)。
鑒于題主是個編程小白,可以買一本Python數據分析的書來看看,相較于網絡上的Blog教程,書本的講解會更有章法,也更詳盡一些。
《利用Python進行數據分析》:講的是利用Python進行數據控制、處理、整理、分析等方面的具體細節和基本要點,介紹Python編程和用于數據處理的庫和工具環境。
《Python數據可視化編程實戰》:一本使用Python實現數據可視化編程的實戰指南,介紹了如何使用Python最流行的庫,通過60余種方法創建美觀的數據可視化效果。
雖然SQL 、Excel、Python等工具是入門數據分析必不可少的敲門磚,但一個優秀的數據分析師不可能只靠運用“工具”,畢竟在這個全員轉向互聯網的時代,想要靠一些通過教程就可以習得的基礎技能就超過其他人,是不可能的。若想要在一眾新人中脫穎而出,在數據分析上更深入地發展,一定還要用“腦”:
具備數據分析的知識與核心技能,培養自己的思維能力
了解企業內數據分析崗的定位,如何依靠數據來進行決策
對于這一部分的進階知識,接下來我想配合貪心學院與騰訊課堂的聯合培養課程《商業數據分析》來進行講解。市面上的課程里,貪心AI的課程對邏輯思維、業務分析、工具/工程能力有較好的整合,課程不僅僅只是介紹EXCEL、SQL、Python、Pandas、NumPy、Matplotlib、PyEcharts、PowerBI、Tableau等必備工具,更注重有意識地培養形成一套解決問題的邏輯能力,以及面對不同的場景應用不同分析模型解決問題的能力,很適合用于學習與講解數據分析的進階知識。
一、了解企業內數據分析崗的定位
成為數據分析師,首先需要知道一般互聯網企業數據流轉流程,不能做只懂技術不懂業務的“工具人”。
數據流轉流程主要有以下六個節點:數據獲取、數據存儲、數據挖掘分析、數據報表搭建、數據分析及可視化、商業分析及決策建議。其中,每一個節點都與數據分析息息相關,了解每一個節點的分工與任務,才能做好工作間的合作銜接,找準自己的工作定位。以數據分析挖掘為例,數據挖掘會挖掘出對決策有潛在價值的關系、模式和趨勢,并用于決策支持的模型,提供預測性決策支持的方法、工具和過程,一般企業內會有專門的數據挖掘部門通過算法挖掘數據指標間的內部聯系,大數據分析、BI或算法部門將會負責完成機器學習的算法實踐。
為什么數據分析師不能只懂技術?
1、從可行性角度出發,技術不是解決問題的萬能藥水:
? 技術難關無法短期突破
? 沒有足夠資金進行技術投入
2、從投資回報率的角度出發,技術投入的邊際效應明顯:
? 對企業而言,避免"短板效應"需要均衡產品、營銷、技術等多維度的發展
? 對個體而言,技術積累+業務經驗是提升能力稀缺度的不二之選
數據分析師與一線業務運營者的區別是什么?
宏觀區別是數據量的不同導致了業務決策權的不同。
微觀區別是數據分析技能的不同導致了業務理解深度的不同。
? 生命周期分析:根據不同階段數據特征判斷產品/用戶生命周期
? 用戶分層分析:以RFM分析為代表
? 用戶行為分析:線性回歸分析+邏輯回歸分析
? 倉儲供應鏈分析:仿真模擬+回歸分析
二、掌握數據分析師的核心技能
數據分析師的核心技能——數據分析能力與思維邏輯能力,這在貪心的數據分析課程的第二周就進行了詳細講解,可見它們的基礎不動搖地位。
簡單來說,互聯網數據分析的基本思路是:找出問題(描述性分析)->分析問題(診斷性分析)->解決問題(數據報告+決策性分析)
描述性分析是指通過計算數據的集中性特征和波動性特征以了解數據的基本情況(關鍵知識點:平均數、標準差、分布規律、可視化方法)
診斷性分析指深入挖掘問題根源,識別依賴關系,找出影響因子(關鍵知識點:多變量回歸中如何找到關鍵性變量)
預測性分析用來說明未來可能發生的事情(關鍵知識點:線性回歸、邏輯回歸)
仿真模擬利用數學仿真來模擬各種條件下產生的結果
數據分析的老玩家對此已經輕車熟路,但干巴巴的講解對于新手可能并不友好,所幸課程里運用了許多例子作為講解。例如,以用戶畫像為例講解描述性統計指標的Excel處理,以電商零售銷量預測案例為例進行預測性分析,以零售倉儲備貨案例為例進行仿真練習……
當你掌握了數據分析的基本工具與核心技能,就可以開始動手做一些項目檢驗自己的學習成果了,項目不僅可以讓你在實踐中快速成長,對未來的求職也大有幫助。
但首先,我要給出一份爆款的項目經歷 :泰坦尼克號生存預測、波士頓房價預測、共享單車需求預測……是不是覺得很熟悉?有些項目,在Kaggle上都能找到源代碼,含金量很低,HR對此也心知肚明。
所以項目一定要刷好、刷精,要具有高含金量與認可度,真正貼近企業對數據分析的需求。
如果沒有接觸好的企業項目的途徑,也可以看看上文推薦的貪心數據分析課程。首先,它與騰訊課堂合作,在含金量與認可度上有保證;其次,課程的老師都是在百度、騰訊等互聯網大廠真正任職過的,項目本身也與企業聯系緊密,與企業的需求相貼近。
舉個例子:嗶哩嗶哩會員購平臺訂單報表分析項目
相信很多年輕人對bilibili并不陌生,電商數據分析案例用了bilibili會員購的例子,講解時也更容易理解。
由于b站以ACG文化起家,用戶喜歡它的亞文化氛圍,于是b站購買了眾多日漫、國漫版權,圍繞知名IP做起了產業鏈和服務,如手辦商品的售賣。b站會員購直接給b站用戶發送短信消息,只要不換號,打開b站就有可能看到推送消息;比起可能跑路的某寶商家,b站作為大平臺更具有可靠性;b站采用大規模銷售模式,商品單價低,消費者更愿意購買……
在該項目中,可以學會結合平臺內部數據與平臺外部數據進行分析,同時學會對數據的描述性分析(平均數、標準差、數學分布、多維可視化分析、關聯系數、詞頻分析等),在應對多數據來源時,學會使用數據分析工具統一數據格式進行分析。分析工具的使用與數據思維的鍛煉在項目中很好地結合。
剛剛在上文中也提到了簡歷的問題,面試的準備是進入數據分析崗的臨門一腳,貪心專門利用最后一個章節講述了數據分析師的面試準備,對簡歷、發展規劃、關鍵問題與應對思路等相關問題都提出了解決策略,利用平臺優勢,在騰訊課堂就業專區也有崗位推薦。
不過話說回來,成功拿到offer,需要技巧的加持但更需要真正的實力,為了避免爆款簡歷的出現,最核心的其實是真正豐富自己的知識、技能以及項目經歷。穩扎穩打,以自己的節奏不斷進步,才能在數據分析這條路上走得更遠。
總結
以上是生活随笔為你收集整理的成为一名优秀数据分析师的必经之路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: czc是什么交易所
- 下一篇: 较低风险低风险哪个小