阿里算法工程师公开机器学习路线,你的路走对了吗?
大家好,我是chris,工科碩士出身,入行前5年在一家上市游戲公司做算法,從數(shù)據(jù)挖掘算法在業(yè)務(wù)線落地開始,涉及機(jī)器學(xué)習(xí)、深度學(xué)習(xí),后來(lái)逐步負(fù)責(zé)整個(gè)算法團(tuán)隊(duì)建設(shè)。
現(xiàn)在就職于阿里,也是負(fù)責(zé)算法方面工作,涉及到的領(lǐng)域涵蓋CV、NLP、網(wǎng)絡(luò)發(fā)現(xiàn)等,業(yè)務(wù)線也擴(kuò)展到廣告、運(yùn)營(yíng)、客服、風(fēng)控等各個(gè)方面。
在選擇碩士方向時(shí),結(jié)合當(dāng)時(shí)的各方信息,個(gè)人認(rèn)為數(shù)據(jù)科學(xué)會(huì)在未來(lái)的30~50年蓬勃發(fā)展。所以選擇當(dāng)時(shí)沒(méi)多少人選的模式識(shí)別,從今天回頭來(lái)看,當(dāng)時(shí)的看法十分正確。所以,眼界和選擇有時(shí)候真的非常重要。
不斷前行的人工智能
在我從事算法崗的這幾年,人工智能確實(shí)發(fā)展十分迅速,不再局限于實(shí)驗(yàn)室,大規(guī)模的商業(yè)應(yīng)用開始出現(xiàn),特別是在人臉識(shí)別、語(yǔ)音識(shí)別、廣告推薦、金融風(fēng)控等領(lǐng)域有十分廣泛的應(yīng)用。
目前,我國(guó)人工智能、深度學(xué)習(xí)等領(lǐng)域依然有很大的人才缺口,預(yù)計(jì)2030年就有超過(guò)500萬(wàn)人才缺口,說(shuō)各家公司砸錢“搶”人也毫不過(guò)分。
2018年最新數(shù)據(jù):python、大數(shù)據(jù)、人工智能從業(yè)者薪資表
李開復(fù)就說(shuō)過(guò),“在硅谷,做深度學(xué)習(xí)的人工智能博士生,現(xiàn)在一畢業(yè)就能拿到年薪200萬(wàn)到300萬(wàn)美元的錄用通知,三大公司(谷歌、臉書和微軟)都在用不合理的價(jià)錢挖人。而在我的身邊,算法崗3年以上月薪3萬(wàn)(并不是大廠)以上很常見(jiàn)。
哪些人適合學(xué)機(jī)器學(xué)習(xí)?
時(shí)至今日,人工智能已經(jīng)成為了獨(dú)立學(xué)科,并且開始對(duì)本科學(xué)生開放,隨著開源框架層出不窮,使得算法門檻逐漸降低,很多 AI 新人可在短時(shí)間內(nèi)熟悉標(biāo)準(zhǔn)化的開源工具進(jìn)行實(shí)戰(zhàn)。在我以往的經(jīng)歷中,下類幾類轉(zhuǎn)人工智能水到渠成:
①數(shù)學(xué)、統(tǒng)計(jì)等理工類應(yīng)屆生。理工類學(xué)生往往較好的數(shù)學(xué)基礎(chǔ),雖然數(shù)學(xué)理論運(yùn)用在工程實(shí)踐中優(yōu)先級(jí)不是很高,但想要深入機(jī)器學(xué)習(xí),理論知識(shí)往往決定了你能走多遠(yuǎn)。
②Python及其它開發(fā)語(yǔ)言使用者。對(duì)于跨職業(yè)向人工智能發(fā)展的開發(fā)者來(lái)說(shuō),熟悉項(xiàng)目開發(fā)流程能很好地幫助我們理解算法原理和應(yīng)用場(chǎng)景,尤其是python語(yǔ)言使用者,優(yōu)勢(shì)十分明顯。
③數(shù)據(jù)分析師。所有拋開大數(shù)據(jù)的人工智能是偽科學(xué),數(shù)據(jù)分析也是入門機(jī)器學(xué)習(xí)的必備技能。
④其它互聯(lián)網(wǎng)崗位。在人人編程的年代,懂一點(diǎn)技術(shù)總沒(méi)錯(cuò)。特別是作為用戶和技術(shù)紐帶的產(chǎn)品經(jīng)理,懂人工智能技術(shù)在垂直領(lǐng)域有不小的職業(yè)加分項(xiàng)。
那么要怎么入門機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是一門融合概率論、線性代數(shù)、凸優(yōu)化、計(jì)算機(jī)、神經(jīng)科學(xué)等多方面的復(fù)雜技術(shù),常常讓人覺(jué)得晦澀難懂。但撇開學(xué)術(shù)界需求,其實(shí)大部分人最終不會(huì)從事算法研究,而會(huì)奮斗在一線應(yīng)用領(lǐng)域。
如何入門機(jī)器學(xué)習(xí),我建議從實(shí)際工程角度出發(fā)逆推出能力模型。我們先來(lái)用一個(gè)小型NLP項(xiàng)目流程來(lái)舉例,讓大家了解機(jī)器學(xué)習(xí)項(xiàng)目有哪些大的環(huán)節(jié)
1.獲取數(shù)據(jù)。包括業(yè)務(wù)部門、公司積累大量的文本數(shù)據(jù)和自己網(wǎng)上下載、爬取的數(shù)據(jù),然后進(jìn)行加工。
2.數(shù)據(jù)預(yù)處理。數(shù)據(jù)處理大概會(huì)占到整個(gè)50%-70%的工作量,通過(guò)數(shù)據(jù)洗清、分詞、詞性標(biāo)注、去停用詞四個(gè)大的方面來(lái)完成語(yǔ)料的預(yù)處理工作。
3.特征工程。做完語(yǔ)料預(yù)處理之后,接下來(lái)需要考慮如何把分詞之后的字和詞語(yǔ)表示成計(jì)算機(jī)能夠計(jì)算的類型。把中文分詞的字符串轉(zhuǎn)換成數(shù)字,有兩種常用的表示模型分別是詞袋模型和詞向量。
4.特征選擇。構(gòu)造好的特征向量,是要選擇合適的、表達(dá)能力強(qiáng)的特征。特征選擇是一個(gè)很有挑戰(zhàn)的過(guò)程,更多的依賴于經(jīng)驗(yàn)和專業(yè)知識(shí),并且有很多現(xiàn)成的算法來(lái)進(jìn)行特征的選擇。
5.模型訓(xùn)練。對(duì)于不同的應(yīng)用需求,我們使用不同的模型,傳統(tǒng)的有監(jiān)督和無(wú)監(jiān)督等機(jī)器學(xué)習(xí)模型,如 KNN、SVM、Naive Bayes、決策樹、GBDT、K-means 等模型;深度學(xué)習(xí)模型比如 CNN、RNN、LSTM、 Seq2Seq、FastText、TextCNN 等。
6.評(píng)價(jià)指標(biāo)。訓(xùn)練好的模型,上線之前要對(duì)模型進(jìn)行必要的評(píng)估,目的讓模型對(duì)語(yǔ)料具備較好的泛化能力。
7.模型上線應(yīng)用。模型線上應(yīng)用,線下訓(xùn)練模型,然后將模型做線上部署,發(fā)布成接口服務(wù)以供業(yè)務(wù)系統(tǒng)使用。
我們可以看到一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目的完成,開發(fā)者除了要具備數(shù)學(xué)與編程語(yǔ)言基本能力外,實(shí)際上更多是對(duì)具體算法、模型運(yùn)用要求,而且面對(duì)具體業(yè)務(wù)也要有相應(yīng)的圖像、語(yǔ)音、NLP等深度學(xué)習(xí)知識(shí)。
為了能具體解決初學(xué)者人工智能入門難的問(wèn)題,我特地邀請(qǐng)了三位人工智能領(lǐng)域的專家,包括一位清華博士科的@Beck Wang,一位計(jì)算機(jī)視覺(jué)方向的專家@Angela,一位百度的數(shù)據(jù)挖掘工程師@熊貓醬,以具體工作流為核心,針對(duì)學(xué)習(xí)者各個(gè)機(jī)器學(xué)習(xí)核心能力進(jìn)行培養(yǎng),舉辦了一個(gè)為期8天的人工智能訓(xùn)練營(yíng)。
我們將分別從各自擅長(zhǎng)的四個(gè)領(lǐng)域:python數(shù)據(jù)分析、機(jī)器學(xué)習(xí)理論、機(jī)器學(xué)習(xí)數(shù)學(xué)、算法工作流,以我們?cè)诖髲S具體工作流逆向指導(dǎo)理論學(xué)習(xí),規(guī)劃學(xué)習(xí)路線,是不可多得的入門級(jí)課程,旨在為廣大的AI愛(ài)好者和跨行學(xué)習(xí)者提供堅(jiān)實(shí)的基礎(chǔ)。
學(xué)習(xí)形式:
1.全程直播形式
2.作業(yè)1V1批改
3.助教跟班
4.交流群答疑
5.結(jié)業(yè)測(cè)試
《8天入門人工智能特訓(xùn)營(yíng)》
5月19日-26日
課程大綱:
同時(shí),為了保證學(xué)習(xí)質(zhì)量,本次訓(xùn)練營(yíng)限量300名學(xué)員免費(fèi)學(xué)習(xí),這里不僅僅有干貨,還有導(dǎo)師盡心為你在線解答疑問(wèn),更有同伴一起相互監(jiān)督鼓勵(lì),這些福利都限時(shí)免費(fèi)!
掃描下方的二維碼
添加助教小姐姐微信
回復(fù)“人工智能”
即可搶占人工智能免費(fèi)車票
交流群直播期間還會(huì)放出實(shí)物抽獎(jiǎng)
總結(jié)
以上是生活随笔為你收集整理的阿里算法工程师公开机器学习路线,你的路走对了吗?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 数据分析入门极简书单
- 下一篇: 程序员毕业的10年里