机器越“智能”,数据标注员越容易被淘汰?丨曼孚科技
有這樣一類人,他們是AI行業的賦能者,是智能時代的奠基人,他們就是人工智能背后的“人工”——數據標注員。
數據標注員的職責是幫助機器習得“知識”,或者換一種說法,他們的想法決定了AI的想法。AI繁榮的這些年,有數以億兆級的數據信息傳遞到標注師的電腦前,被他們手動“智能化”。
而如今,隨著數據標注不斷迭代升級,很多人擔心數據標注師或許很快就會離開時代舞臺…… 原因背后,無疑是數據標注員的工作特點導致,首先讓我們來了解一下數據標注員都做些什么。
如何成為一名數據標注員
數據標注發展到現在,“數據標注員就是AI的老師”這種說法已然不太準確,因為老師只負責“教”,無需對特定情況下的結果負責。而標注則不然,這是一個技術活,作為一名標注員需要對標記物體進行拉框、標點等,讓計算機學習什么是人臉、什么是車輛、如何聽懂方言、一句話可以有多少層含義等等。
因此,這就是大多數人將數據標注員描述為每天上班只需動動鼠標即可的原因。從標注小白到標注成手只需經過幾天的培訓就能做到,而這種易上手的工作也成為了許多地區“脫貧”的重點培養產業。
數據標注集中地區
在數據標注剛興起的那幾年,各大互聯網巨頭紛紛意識到數據的重要性,并著手建立了自己的數據基地。但值得注意的是,這些大廠并沒有將基地建在發達地區,而是選擇了那些相對較貧困的地區。例如百度將數據總基地建在了山西,阿里、華為選擇了貴州,騰訊則直接將平臺放在線上,讓數據標注成為了“全民兼職” 。
除各大廠商外,許多貧困山區也選擇引入數據標注行業,培養當地村民成為數據標注員,實現脫貧奔小康。
所以,既然連沒碰過電腦的村民也可以成為數據標注員,從事數據標注員的主要都是哪類人呢?
數據標注人群主要都有哪些
業內人士評估,全職的數據標注員如今已達10萬人,兼職人群的規模更是達到100萬。
這其中,學生占了很大一部分,尤其是職業學校的學生,這些學生唯一能觸碰到人工智能影子的工作就是數據標注。并且隨著大廠的介入,市場最后比拼的就是成本,許多大廠會將數據包給中型數據標注公司,而這類公司又將數據分給小型公司、小型團隊,有的團隊甚至還會繼續將數據分散下去,層層疊加,利潤早已所剩無幾。所以,學生,尤其是那些還沒畢業的在校學生,就成為了最好的勞動力。
除去學生外,許多步入社會的人也在該行業里徘徊,這其中包括失業的白領、山區農民、甚至連殘障人士也能成為數據標注的一員,他們有的希望利用這個行業過渡、有的靠它養家糊口。總之,這個行業的優勢很明顯,極低的門檻讓它成為許多社會底層人士的救命稻草。
而優點往往也是缺點,門檻低意味著可替代性強,許多數據標注員已察覺到這點,但苦于對這個行業的未來沒有規劃。在勞累的工作之余,想到自己終有一天會被替代,焦慮感隨之而來,累著身體,心理也同樣在內耗。
其實,數據標注行業的前景非常廣闊,且隨著人工智能的不斷拓進,這一行業將會越來越輝煌。作為數據標注員,要如何做才能抓住時代的橋梁,成就自己?
數據標注員如何轉業
隨便一翻網絡上對數據標注員的評價,“沒前途、沒技術、末位淘汰制、無腦機器…”,這種持悲觀想法的評論比比皆是。而靜下心想一想,任何一門行業剛入門檻時都會面臨易被淘汰的風險,在行業初期職業類型單一是很正常的。對于缺少技術傍身的普通人,最小的投入與最易得的經驗才是硬道理。
而對于已經入職較長時間的標注老手來說,轉型的方向無疑分為兩條:技術或管理層面。下圖為數據標注相關職位類型,可以嘗試先從審核員做起,再慢慢過渡到其他職位中。
對于那些想繼續從事數據標注行業的人,深化自己的專業知識極其重要。國家去年頒布的新職業——人工智能訓練師,正是打破現狀的絕佳機會。
人工智能訓練師共有五個等級,數據標注僅是淺顯的表皮工作,作為人工智能訓練師,還要熟悉機器學習的基本算法,提供合理的行業解決方案,其次該職業對理解力也有較高要求,需要訓練師分析客戶語料,完成校驗工作,并不斷優化豐富產品知識庫,完成人機交互設計的管理及各種輔助工作等等。
現階段,新興職業的出現意味著數據標注將愈加專業規范化,數據標注不再是一個勞動密集型行業,更是知識密集型產業,努力提升自己的等級,成為優秀的人工智能訓練師也會是不錯的出路。
結語
馬云曾有一句名言:“很多人因為看見才相信,只有少數人相信才看見。”
數據標注員——正如別人評論的那樣,他們的工作的確很像數字世界的建筑工人,但是他們扮演著很重要的角色,因為沒有他們,AI這棟摩天大樓就無法建成。
在人工智能行業愈加發達的今天,頂層算法需要海量數據輔助,而數據必須由人工完成,所以人工智能的未來仍將依靠各位標注員的共同努力與堅守。
總結
以上是生活随笔為你收集整理的机器越“智能”,数据标注员越容易被淘汰?丨曼孚科技的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HTML - label标签
- 下一篇: 蜗牛一般的UAP开发(零)初识UAP