头部数据人才24小时图鉴
數據時代的到來,讓數據科學紅了一把。?
雖然是近幾年才火起來的概念,但大家都擠破頭想進入這個行業。《哈佛商業評論》更是宣稱“數據科學家”是二十一世紀最性感的職業。?
數據科學這么紅不是沒有原因的,拿著令人艷羨的年薪,用手中的數據主導新產品甚至驅動公司的決策...而這個行業其實也在不斷發展,相比幾年前,數據人的工作方式和生活方式都得到了巨大的變革。?
那些頭部數據人才,他們典型的24小時是怎樣的?我們從剛剛升級的和鯨科技找到了答案。?
和鯨科技,前身為數據科學平臺“科賽網(Kesci.com)”,于2019年元旦正式更名,旗下有聚集了超過50,000+數據智能人才的專業第三方數據科學社區kesci(科賽網),具備國際領先水平的數據分析及AI開發協作工具kescilab(簡稱“K-Lab”)。
上班8小時:效率升級,“云端+協作”提升工作效果
數據科學家主要的工作內容就是根據公司需求,從數據中攫取商業價值。而頭部數據人才和普通數據科學家最大的區別就是:效率。公司支付的高薪酬也是在購買他們的高效率。
云端工作?
不同于“數據科學家”這個職業剛剛出現的時代,從業者需要不斷“遷就”手中的程序、甚至花很長時間學習功能。在數據科學高速發展的2019,他們需要更高的效率,提高效率的工具應運而生,這些工具需要不斷預判和滿足他們的需求。在線編程就是一個很重要的痛點,通過在線編程,不僅能免去繁瑣的環境配置,還為提升工作效率加了一條助跑道:不用考慮電腦在不在身邊、不用在乎文件有沒有拷貝,所有資料都在云端同步,只需專注于手中的代碼、數據、圖表。 但這并不好做,除了要直接在云端提供算力,在線編程工具還得保證環境統一,所以直到近幾年才有相關產品誕生。?
K-Lab是一款在線協作工具,引入Jupyter Notebook范式——這是專門為數據分析設計的工作環境,能夠隨時隨地在云端開展數據處理、模型搭建、代碼調試、撰寫報告、團隊協作等系列數據分析工作,數據科學家的工作將不再局限于本地環境,周末登山也能掏出手機訓練模型、調整參數。?
團隊協作?
與純粹的程序員不同,數據科學家作為一個更偏商業應用的崗位,它需要和數據分析師團隊,甚至是其他部門共同協作、指導公司的發展,也就更需要數據可視化和講故事的能力。原因很簡單,如果團隊、客戶甚至都聽不懂你想做什么,即使你的代碼、分析過程再優雅再準確,都只是白費力氣。?
試想,當你向團隊解釋你的分析成果,他們更愿意看這一大段“不知所云”的代碼,還是右邊這張圖呢?
▲?圖源自和鯨科技 - K-Lab
K-Lab的協作功能同時考慮了兩種場景:?
數據分析師團隊交流時,常常需要互相修改源碼,如果大家使用的計算環境、甚至編程語言都不同,效率未免也太低了。考慮到這種情況,K-Lab統一了計算環境,增加Fork、版本管理等功能,打開網頁就能完成整個數據分析工作;?
如果你需要與非技術人員溝通,他們可不想看到密密麻麻的代碼。在K-Lab中,不需要你重做一份PPT,只要一鍵隱藏代碼,負責人便只看得到最后的圖表、在線評論,同時“點贊+1”。這樣,所有人能快速理解你的分析結果并且參與協作、提高生產效率。而且,界面清爽易讀,把實時運行的代碼、文本和可視化的圖整合在一起,提升數據科學家講故事、做決策的能力。?
目前清華大學、北京大學、中國人民大學、上海交通大學、浙江大學等知名院校已采用K-Lab進行數據科學與人工智能的教學與實訓平臺,也幫助了中國聯通、中國平安、招商銀行、騰訊、百度、攜程、IBM、華為、南京市政府在內的一批頂尖客戶解決行業問題。
下班4小時:社交升級,社區生態加速學習
據《2018數據人才白皮書》調查,數據科學人才平均每天學習時間大于4小時,而頭部數據人才學習的時間則普遍更長,也許這是他們優秀的原因之一。?
但僅僅保證學習時間就夠嗎?技術飛速發展, 人的升級跟得上摩爾定律嗎?顯然,學習方法和學習效率缺一不可。?
和鯨科技承辦了多場數據競賽,大賽結束后,都會對獲獎者進行采訪。從這些采訪中,我們了解到,他們在課余時間/工作之余提升自己的辦法十分類似——“在實踐中學習”,幾乎都是混論壇、看論文、打比賽。競賽就是一種重要的實踐方式,在競賽中,他們能夠直接接觸到一線企業的場景和真實的行業數據。悶頭做技術已經很難適應新時代,我們更需要通過與人交流共同升級。?
一般來說,初學者可以通過書本或課程學習新技術,三五年后就主要從做項目、看論文來提升自己了。而實踐能夠貫穿學習的全過程,數據競賽平臺就是源源不斷的實踐機會,從初學者到大神都能找到機會。數據科學家可以從中尋找合適的項目,如果獲獎了一般還有幾萬元獎金。
▲?內容源自和鯨科技 - 科賽網(Kesci) - 比賽
要是心血來潮想研究某個問題呢?找到感興趣的數據集,再開始自己的分析就好。
▲?內容源自和鯨科技 - 科賽網(Kesci) - 比賽
和鯨科技的社區就是一個給數據人成長、交流的生態系統,能夠貫穿數據科學家成長的全過程: 通過科小神訓練營入門后,科賽社區的“項目”欄中提供了由淺到深的學習資料,用戶可以直接下載數據集或者fork項目,等學到一定程度后,就可以在“比賽”中開始數據競賽之路。每個環節都配備了相應社群,把與你等級類似的人鏈接在一起,你可以在社區、社群和大家一起打怪升級。?
從2015年搭建時,和鯨科技就開始聚集各大高校的數據科學人才,隨后,從高校不斷輻射到各大互聯網企業、500強技術人才,現在已經有超過50,000+的數據智能人才在其中分享技術,沉淀了100+行業頂尖企業數據實操案例、6000+數據算法應用案例和5000G+優質數據集資源,數據集能夠直接在K-Lab工作專區掛載,節省不必要的實踐,專注于探索性數據分析,與社區的伙伴共同進步。
數據人未來的工作方式
上班8小時和下班4小時,工具和社區的升級,最終帶來的是生活方式的變革。數據科學家并不是代碼機器,他們不像人們的刻板印象那樣:格子襯衫、黑框眼鏡反著光,對著電腦敲代碼。?
在數據人典型的一天中,提升工作效率、保證學習時間是很重要的一個因素,保持自我升級,是立于市場的不變法則。
在和鯨科技的工具+社區+眾包的生態中,數據科學家也得以擯除落后的工作方式,能夠在社區內用在線編程、協同的方式,提升工作效率;能夠面對市場團隊、甚至甲方講述自己的技術思考,甚至在閑暇時間內,在社區尋找項目給自己升升級;在線編程也讓平板、手機編程成為可能,不用再為了一個Bug在周末跑回公司。?
你如何過一天,就如何過一生。和鯨生態帶給數據科學家的,不僅是工作效率,更是數據人未來的工作方式。?
剩下的十二個小時你們會如何安排呢?快來和鯨社區跟我們分享吧。?
掃描以下二維碼參與和鯨新年活動:
點擊以下標題查看更多文章:?
自動機器學習(AutoML)最新綜述
自然語言處理中的語言模型預訓練方法
從傅里葉分析角度解讀深度學習的泛化能力
兩行代碼玩轉Google BERT句向量詞向量
近期知識圖譜頂會論文推薦,你都讀過哪幾篇?
TensorSpace:超酷炫3D神經網絡可視化框架
深度長文:NLP的巨人肩膀(上)
NLP的巨人肩膀(下):從CoVe到BERT
#投 稿 通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢??答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
??來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
? 投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 獲取最新論文推薦
總結
以上是生活随笔為你收集整理的头部数据人才24小时图鉴的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从动力学角度看优化算法:自适应学习率算法
- 下一篇: 近期值得读的10篇GAN进展论文