Google首席决策师告诉你,AI和数据科学团队需要哪10种角色
導讀:組建一個出色的數(shù)據(jù)團隊都需要哪些角色?Google 的首席決策工程師 Cassie Kozyrkov 在這一問題上有自己獨到的見解。在她看來,一個好的 AI 和數(shù)據(jù)科學團隊需要 10 種不同的角色。無論你是公司的管理者、招聘者,還是想在數(shù)據(jù)科學領域工作的求職者,都可以在這篇文章中找到對自己有用的信息。
作者:Cassie Kozyrkov
譯者:linstancy、王天宇
來源:AI科技大本營(ID:rgznai100)
▲Google 的 Geoffrey Hinton 是我的偶像,也是深度學習領域的開山鼻祖,但我不希望一個團隊中有10個 Geoffrey Hinton 這樣的成員而沒有其他角色
應用數(shù)據(jù)科學是高度跨學科的領域,依賴于整個團隊的共同協(xié)作,多角度的觀點尤為重要。事實上,觀點和態(tài)度的重要性僅次于教育和經(jīng)驗。
如果你想要通過智能的工程決策方法使數(shù)據(jù)變得有用,并且希望從事相關的職業(yè),那么下面我對團隊發(fā)展中的角色順序(從0開始)提出的看法或許對你會有幫助。
00?數(shù)據(jù)工程師
在數(shù)據(jù)分析之前,你要獲取所需的數(shù)據(jù)。如果你需要處理的是小型數(shù)據(jù)集,那么數(shù)據(jù)工程實際上就是在電子表格中輸入一些數(shù)字。但當你需要處理大規(guī)模數(shù)據(jù)時,數(shù)據(jù)工程本身就成為了一門復雜的學科,就需要團隊中有一個人來專門負責處理棘手的工程問題,以便團隊中其他人基于此協(xié)同工作。
01 決策者
在你想聘請一位博士畢業(yè)的數(shù)據(jù)科學家前,其實更需要擁有一位了解數(shù)據(jù)驅(qū)動決策的科學決策者。
他主要負責決定哪些問題可以用數(shù)據(jù)來解決,進行初步規(guī)劃,并從商業(yè)角度來確定所需的分析級別。一位深思熟慮的人,他不會一直說,“哦,哎呀,我在思考這個決定時甚至都沒有想到這種狀況。” 作為決策者要考慮周到,思考所有可能的情況并作出決策。
02 分析師
數(shù)據(jù)分析師是你下一個需要考慮的角色。他有能力查看數(shù)據(jù)、了解數(shù)據(jù)結構并從中獲得靈感,唯一的不足是他可能對這項工作中需要使用的軟件并不熟悉。如果你看過數(shù)碼照片,那么你已經(jīng)接觸過數(shù)據(jù)可視化及分析了。
學習使用 R 和 Python 等工具只是對 MS Paint 進行數(shù)據(jù)可視化的升級;它們是用來查看多類別數(shù)據(jù)集的一種多功能可視化工具,而不僅僅是 RGB 像素矩陣。
分析師可以利用飯后時間多觀察數(shù)據(jù),從中找到些靈感,肯定比不做這些要好。如果整個團隊的成員都這么做的話,那么你一定可以比其它不這樣做的團隊更能把握行業(yè)的命脈。
▲Nessie 1934:這是數(shù)據(jù),請明智地給出結論
有一點非常重要,作為一名數(shù)據(jù)分析師,所做出的任何結論都不能脫離數(shù)據(jù)。這是一種需要專業(yè)訓練的技能,就如上面的照片一樣,你可以說:“這就是我的數(shù)據(jù)所要展示的內(nèi)容。”但不要因此給出結論,如“尼斯湖水怪真的存在”這樣的言論。
03?專業(yè)分析師
這是一個節(jié)奏很快的角色。勝任這份工作的人要能夠更快速地查看更多數(shù)據(jù)。快速處理數(shù)據(jù),并善于探索發(fā)現(xiàn)有趣的東西是這類人才所需的技能!同時,這一角色不需要給出小心嚴謹?shù)囊庖?#xff0c;而是幫助團隊盡可能多地關注數(shù)據(jù)本身,以便讓決策者了解真正值得關注的因素。
這可能與我們的直覺想法不同,但不要把這樣的工作交給你最信任的,那些很會寫代碼的工程師去做。我們需要的不僅是能夠快速工作的人才,還盡可能快地發(fā)現(xiàn)數(shù)據(jù)背后潛在的信息,而對于那些樂于編程的工程師來說,觀察數(shù)據(jù)可能是比較難的,因此也就很難勝任這份角色的工作。
我曾見過一名分析師被工程文化濃厚的團隊欺負,因為團隊成員顯然沒有意識到所謂“優(yōu)秀代碼”很難用描述性分析進行解釋。正是如此,這里的“優(yōu)秀”指的是“高效和謙虛”。如果一個高效但粗心的程序員無法融入團隊,他們自然會離開,而這也證明了自己對業(yè)務反應敏捷。
04 統(tǒng)計學家
現(xiàn)在,我們已經(jīng)找到幫助我們分析數(shù)據(jù)的員工了,而統(tǒng)計學家能夠協(xié)助決策者在分析數(shù)據(jù)后得到嚴謹、有依據(jù)的結論。
我們最好還是控制一下這種"喂數(shù)據(jù)"的瘋狂。如果你能克制住學習真實情況之外的沖動的話,那么看“Nessie”這張圖沒問題。但是你會克制住嗎?盡管人類非常擅長于合理分析圖片,但其他數(shù)據(jù)類型似乎無法用常理解釋。所以,統(tǒng)計學家的出現(xiàn)可能有助于團隊在分析數(shù)據(jù)后得到嚴謹、有據(jù)的結論。
例如,如果你的機器學習系統(tǒng)正在一個數(shù)據(jù)集上工作,那么所有你能得出的結論都是基于該數(shù)據(jù)集的。換句話說,你的系統(tǒng)在該數(shù)據(jù)集上是起作用的,但它在生產(chǎn)過程中也一定會起作用嗎?你能得出這個結論嗎?這時候你就需要一些額外的技能來處理這些問題,統(tǒng)計方面的知識或許能幫到你。
靈感是很便宜,但嚴謹?shù)膽B(tài)度是昂貴的。很多時候我們可以用純粹的靈感來滿足自己。
在你需要認真做出一個決定之前,如果還沒有完全地認識到事實真相的話,那么請放慢速度,謹慎思考。
05 應用型機器學習工程師
對于一個應用型的 AI /機器學習工程師來說,最好的品質(zhì)并不是知曉算法如何工作。工程師的日常工作是使用這種算法,而不是構建它們 (這是研究人員所做的事)。我們需要的是那些擁有與現(xiàn)有算法匹配的編程能力,并應用于數(shù)據(jù)集的工程能力。
除了需要快速編程的能力,這類工程師還需要具備能應對失敗的品質(zhì)。你可能永遠不會知道你正在做什么,即使你的意識里覺得自己正在做。通過算法盡可能快地運行數(shù)據(jù),并查看算法是否能夠正常工作......在這過程中你可能會經(jīng)歷遠多于成功的失敗過程。這類工作很大一部分需要工程師去不斷地嘗試,因此你需要不斷應對失敗的過程;同時,具備從容應對失敗的能力,將讓你更好地勝任這份工作。
由于日常所碰到的業(yè)務問題是無法在教科書中找到,因此你事先也無法知道什么算法會起作用,你也不能期望在第一時間獲得完美的結果。你只能盡可能快地嘗試很多方法,并不斷迭代以找到最好的解決方案。
談到“針對什么數(shù)據(jù)用什么算法”這個問題,對于分析師而言,他們會認為這些輸入很有意思。這也不難理解為什么要先有數(shù)據(jù)分析師了。
雖然在問題解決過程會碰到很多磕磕絆絆,但機器學習工程師必須要嚴謹?shù)厣钊敕椒ㄔu估這個至關重要的部分。得到的解決方案是否真的適用于新數(shù)據(jù)呢?幸運的是,你在之前已經(jīng)有了一個明智的決定,現(xiàn)在需要做的是將這個接力棒傳給統(tǒng)計學家。
此外,最強的應用型 ML 工程師要非常清楚應用不同方法所需要的時間。
06 數(shù)據(jù)科學家
在這里,我所說的數(shù)據(jù)科學家,是具備前面提到的三個角色技能的全面專家。不是每個人都使用我這里的定義,也有具備三選一的專家能力時也自稱自己是“數(shù)據(jù)科學家”,在這里需要注意區(qū)分一下。
在數(shù)據(jù)科學團隊中,我將這個角色排在第6位,因為能夠聘請到一個真正集三者技能于一身的數(shù)據(jù)科學家,是一個昂貴的選擇。如果你有足夠的預算,那么這是一個不錯的選擇。但如果沒有充裕的經(jīng)費,可以考慮培養(yǎng)現(xiàn)在具備單一技能的專家。
07 分析經(jīng)理/數(shù)據(jù)科學領導
分析經(jīng)理是一個是數(shù)據(jù)科學家和決策者的混合體角色。他們在團隊中的角色是凝聚整個團隊的力量,以確保團隊中的人員不會分崩瓦解,而不是為日常業(yè)務增加價值。這是一個非常少見、也非常難雇傭的角色。
每天他都需要保持清醒的頭腦,思考諸如“如何設計問題更合理? 如何做決策?如何最好地分配我們的專家?什么值得做?技能和數(shù)據(jù)是否符合要求?如何確保輸入數(shù)據(jù)的質(zhì)量?”等問題。
如果你能夠聘請到一位這樣的分析經(jīng)理,那么恭喜你和你的團隊,你們很幸運,請盡可能地留住這樣的人才,永遠不要讓他離去。
08 定性專家/社會科學家
有時候,你的決策者是一名優(yōu)秀杰出的領導者,經(jīng)理人,激勵者,影響者或?qū)Ш秸?.....但他們在做決策時可能并不具備藝術性和科學性。做決策不僅僅需要天分。如果你的決策者在這方面沒有很扎實的能力,那么他們帶來的損害可能多與收益。
請不要解雇一個技能不夠純熟的決策者,你可以通過專家定性幫助他們提升自身技能。
這類人通常具有社會科學和數(shù)據(jù)科學的背景,如行為經(jīng)濟學家,神經(jīng)經(jīng)濟學家和接受過專業(yè)培訓的 JDM 心理學家,而那些自學成才的人也能夠擅長這份角色。這項工作是幫助決策者理清思路,審視所有角度,并將模棱兩可的直覺感受轉化為成熟的、語言形式的指令,使團隊的其他成員也能夠輕松地執(zhí)行。
通常,定性專家在會完全了解并掌握所有的情況的基礎上,幫助決策者進行決策,而不是片面地對某些情況。他們是值得信賴的顧問,頭腦風暴的伙伴,以及決策者的參謀人。他們的參與可以確保項目朝著正確的方向進行。
09 研究者
許多經(jīng)理在招聘時認為,團隊的第一個成員需要有過當教授的經(jīng)驗,但實際上你并不需要那些博士學位的人才,除非你已經(jīng)知道這一領域的現(xiàn)有算法都已經(jīng)不能滿足你的需求了。但大多數(shù)的團隊通常都不會提前知道,因此只能按照正常招聘流程,這就好比你想在太空中使用一支筆之前,你得先保證這支筆是能夠正常地工作。你可以先試著開始,當現(xiàn)有的方法都不能解決你的問題時,再考慮聘請相關的研究人員。
不要給研究者貼上特殊的標簽。最好的是,等到團隊發(fā)展到一定程度,足以意識到需要研究人員的時候再考慮請他們加入。但這樣也會存在一個問題,換句話說,等到你用完所有可用的工具之后,再雇用你所需要的人,通常需要更昂貴的成本。
▲在發(fā)明在太空筆之前,請檢查現(xiàn)有筆是否能夠正常工作并滿足我們的需求
10+?額外人員
除了以上提到的這些角色,下面我還列舉了一些我比較喜歡的角色,這些角色也將在未來的智能決策項目中發(fā)揮重要的重要:
領域?qū)<?/span>
倫理專家
軟件工程師
可靠性工程師
UX 設計師
交互式可視化/圖形設計師
數(shù)據(jù)收集專家
數(shù)據(jù)產(chǎn)品經(jīng)理
項目經(jīng)理
許多項目離不開這些角色,之所以沒將這些列入前10名,主要是因為做決策并不是他們的主要業(yè)務。相反,他們都是各自學科的人才,并能為各自領域項目的數(shù)據(jù)學習和決策制定做出有用的工作。可以把這些角色想像成各自領域的專家,并對智能決策充滿興趣。
大團隊 or 小團隊?
讀到這里,你可能已經(jīng)不堪重負了。這么多需要了解的角色!深吸一口氣,根據(jù)自己的需要,你可以從前幾個角色中獲得足夠多有價值的信息。
我曾將應用型機器學習比作在廚房中烘焙:如果您個人想要開一家工業(yè)規(guī)模的比薩店,那么你需要一個大的制作團隊或需要與一些供應商/顧問合作。如果你想利用周末時間制作一兩個獨特的披薩,如焦糖鳳尾魚披薩,
那么你仍需要考慮我們所提到的所有角色,包括你要決定做什么 (角色1),使用哪些配料 (角色2和3),在哪里獲得配料 (角色0),如何定制食譜 (角色5),以及如何測試披薩的口味 (角色4),以便制成品能給人留下深刻印象。但如果你只是想用來消遣的話,你可以自己承擔所有的工作。
當然,如果你的目標只是制作標準的傳統(tǒng)披薩,那么你甚至不需要上述提到的這一切:你只需要拿來別人已經(jīng)嘗試和測試過的配方和配料(無需親自重復發(fā)明),就可以開始烤披薩啦!
原文鏈接:
https://hackernoon.com/top-10-roles-for-your-data-science-team-e7f05d90d961
更多精彩
在公眾號后臺對話框輸入以下關鍵詞
查看更多優(yōu)質(zhì)內(nèi)容!
PPT?|?報告?|?讀書?|?書單?|?干貨
Python?|?機器學習?|?深度學習?|?神經(jīng)網(wǎng)絡
區(qū)塊鏈?|?揭秘?|?高考?|?福利
猜你想看
程序員七夕表白攻略:原來數(shù)學才是世界上最浪漫的學科!
七夕關愛單身狗程序猿:4本書給你一個完整的脫單秘籍
泡沫or趨勢?我們到底需要什么樣的區(qū)塊鏈?
新手上路必學的Python函數(shù)基礎知識,全在這里了(多段代碼舉例)
Q:?你是其中的哪種角色?
歡迎留言與大家分享
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯(lián)系:baiyu@hzbook.com
更多精彩,請在后臺點擊“歷史文章”查看
總結
以上是生活随笔為你收集整理的Google首席决策师告诉你,AI和数据科学团队需要哪10种角色的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一文读懂「中台」的前世今生
- 下一篇: 50年后的地球什么样?大数据、AI、量子