对 2018 年 AI 发展预言全中,他们又立了 2019 的 Flag
By 超神經(jīng)
「對于 2019 年數(shù)據(jù)科學、機器學習和人工智能,我們做出了 5 個預(yù)測。同時還回顧一下去年做的預(yù)測,看看有哪些是真的發(fā)生了。 」
作者:William Vorhies
DataScienceCentral 編輯部主任; Data-Magnum 總裁兼首席數(shù)據(jù)科學家; EB5C 主席
對去年預(yù)測的快速回顧
預(yù)測 1:模型制作和數(shù)據(jù)準備將變的更加自動化。更大的數(shù)據(jù)科學運營會集成到一個平臺上。只需少量的數(shù)據(jù)科學家就能勝任許多工作。
這個猜對了,隨著高級分析平臺上端到端的集成,無代碼的數(shù)據(jù)科學正在崛起。
預(yù)測 2:數(shù)據(jù)科學會朝著專業(yè)化方向發(fā)展,而「全棧」的數(shù)據(jù)科學家將不復(fù)存在。
同樣猜對。現(xiàn)在人們對數(shù)據(jù)工程師的關(guān)注度要高于數(shù)據(jù)科學家。因為數(shù)據(jù)工程師更加的實用。
預(yù)測 3:非數(shù)據(jù)科學家比數(shù)據(jù)科學家更能勝任大量而復(fù)雜的分析。
事實如此。從 Data Viz 和 Visual Analytics 的流行,就可以看出,非數(shù)據(jù)科學家從復(fù)雜的數(shù)據(jù)科學工具中獲得了更多的價值。
預(yù)測 4:深度學習困難重重。沒有多少數(shù)據(jù)科學家熟練能掌握這一領(lǐng)域,這會限制人工智能的應(yīng)用,除非深度學習平臺更加簡潔化和產(chǎn)品化。
微軟和谷歌都推出了自動深度學習平臺,它們從遷移學習開始,朝著完整的 AutoDL (自動機器學習)發(fā)展。此外還有一些集成的 AutoDL 平臺。比如 one clicks. ai,就有的完整的 AutoML 和 AutoDL 平臺。Gartner 最近提名擁有 AutoDL 平臺的 DimensionalMechanics 為「五大潮流公司」。
預(yù)測 5:盡管被大肆炒作,但人工智能及深入學習的滲透,以及對市場的影響的廣度和深度都不盡人意。
除了聊天機器人的快速發(fā)展, AI 的應(yīng)用其實很有限。AI 被吹的有些高了,在實際的公司中,真正用到 AI 和機器學習的比例也很小。
預(yù)測 6:公眾(和政府)將開始認真研究 AI 的社會和隱私影響。
看看美國政府以及歐盟即的一些動作,就知道這些問題正在受到重視,如加利福尼亞州即將生效的隱私規(guī)范,以及澳大利亞的反加密聲明。
沒有懸念的,我們在去年的 6 個預(yù)測全都正確。雖然一些看法在今年依然如此,但我們還是嘗試做出更具體一些預(yù)測分析。
對 2019 做的預(yù)測
預(yù)測 1:數(shù)據(jù)將會比算法更重要
深度學習和經(jīng)典機器學習算法方面,已有一年多沒有較大突破了。使用的是稍作改進時間卷積網(wǎng)(TCNs),代替掉了 RNN 以減少 NLP 的延遲,但絲毫沒有創(chuàng)新。好的算法要么早有名氣,要么就是能用自動機器學習弄出來。
目前這個時期,擁有大量優(yōu)質(zhì)數(shù)據(jù)是公司實現(xiàn)數(shù)字化轉(zhuǎn)型的關(guān)鍵,這同時也衍生出了數(shù)據(jù)提供方案的競爭和機會,大致有下面幾個方向。
第一個方向是如何獲得準確標記的訓(xùn)練數(shù)據(jù)。像 Figure Eight 之類從事標簽數(shù)據(jù)的公司,正在推廣具有成本效益的智能策略。比如主動學習就能在標記數(shù)據(jù)和確保模型精度之間作出最佳選擇。
第二個方向是訪問第三方數(shù)據(jù)。像 DymstData 這樣的服務(wù)公司,已經(jīng)進入該領(lǐng)域作為數(shù)百種附加數(shù)據(jù)提供清算所。他們還承擔著保護敏感 PII 的作用,他們的用戶可以強制執(zhí)行角色訪問某些敏感信息,這對金融和醫(yī)療服務(wù)中尤為重要。
第三個方向是自動跟蹤并記錄模型中數(shù)據(jù)的來源。特別是由多個來源的流數(shù)據(jù)被集成,而且實時變化時,知道數(shù)據(jù)來源以及如何使用它,是很重要的一個方面。Tibco 和其他一些分析平臺正在整合此項功能。
預(yù)測2:隨著 AI / ML 將分析平臺移至行業(yè)或流程特定程序,一切將變得更容易。
縱覽 AI / ML 的創(chuàng)業(yè)公司,可以看出競爭正在轉(zhuǎn)向行業(yè)或特定的程序。這些程序或迷你平臺,是專注于解決各種業(yè)務(wù)中的行業(yè)特定問題,如營銷,B2B 銷售,醫(yī)療保健,金融科技以及其他定義的分組。
這些新應(yīng)用程序?qū)W⒂谇度?AI / ML ,從而在企業(yè)更新時,不需要大型內(nèi)部數(shù)據(jù)科學家組的支持,只依賴這些開發(fā)人員。
有人稱這為AI / ML的商品化,但更準確地說,這是 AI / ML 的專業(yè)化。
這樣的轉(zhuǎn)型,就像是 90 年代后期 ,從流程改造(Reengineering) 到企業(yè)資源規(guī)劃( ERPs )的轉(zhuǎn)變。當時 Reengineering 呼吁公司使用復(fù)雜的定制開發(fā) IT 解決方案來改進流程,這為 Oracle,PeopleSoft,SAP 等主要集成 ERP 以及 CRM 等企業(yè)打開了大門。
新的供應(yīng)商都致力于在他們的特定市場中提供廣泛的解決方案,但不可避免地最終得出 ERP 規(guī)模較小的平臺。
另外還要關(guān)注那些沒有大型數(shù)據(jù)科學團隊,或完全依賴定制開發(fā)模型的中型和小型公司,注意它們加快 AI / ML 采用率的問題。
預(yù)測3:數(shù)據(jù)工程師和數(shù)據(jù)分析師的崛起
這不是說世界已經(jīng)放棄了數(shù)據(jù)科學家。還需要一個過程。但當你缺乏某些技能時,市場會以不同的方式填補這種空白。
一種方法是通過上面討論過的行業(yè)和流程特定的智能應(yīng)用,這些應(yīng)用程序不需要大量的內(nèi)部數(shù)據(jù)科學家。
第二種方法是迅速出現(xiàn)的自動機器學習( AML )平臺。這在數(shù)據(jù)科學中更高效,意味著更少的數(shù)據(jù)科學家可以完成許多工作。
由于模型的數(shù)量沒有減少,反而增加了,這會將工作擔子轉(zhuǎn)移給那些具備兩方面技能的數(shù)據(jù)工程師。
首先,他能夠創(chuàng)建數(shù)據(jù)科學所需的基礎(chǔ)架構(gòu),如數(shù)據(jù)湖和 Spark 實例。
其次是采用模型,并確保它們在操作系統(tǒng)中實現(xiàn),并跟蹤準確性和刷新。
有一些數(shù)據(jù)工程師還要負責數(shù)據(jù)操作 ,確保數(shù)據(jù)流的清潔和預(yù)處理。
分析平臺的另一個趨勢是視覺分析和數(shù)據(jù)可視化工具的發(fā)展。現(xiàn)在,這些工具大部分與數(shù)據(jù)科學工具集完全集成,能讓數(shù)據(jù)分析師和 LOB 經(jīng)理提取更多價值,甚至指導(dǎo)分析工作。他們不會取代數(shù)據(jù)科學家,但強化了高級分析正在團隊里的作用。
預(yù)測4:神經(jīng)形態(tài)芯片:AI 與物聯(lián)網(wǎng)走向前沿
這兩種不同的技術(shù)同時都處于半成熟狀態(tài),以解決長期存在的問題——延遲。
例如,考慮當您想要使用移動設(shè)備,將文本或圖像的單詞進行翻譯時,您的設(shè)備會將該信號發(fā)送回發(fā)生到翻譯云中的應(yīng)用程序,然后再返回到你的設(shè)備。
谷歌和其它即時翻譯服務(wù),已經(jīng)從 RNN 轉(zhuǎn)移到專門的 CNN 結(jié)構(gòu),也就是時間卷積網(wǎng)絡(luò),因為 RNN 不能很好適應(yīng) MPP,但 CNN 卻可以。這個轉(zhuǎn)換減少了延遲,但信號還是完整的。
解決此問題的一種技術(shù)是 5G 網(wǎng)絡(luò)。大家都知道 5G 會很快,但它真正的好處在于可以承載更大的流量。
第二個解決方案是引入新的神經(jīng)形態(tài)芯片(也叫脈沖神經(jīng)網(wǎng)絡(luò))。這種神經(jīng)網(wǎng)絡(luò)架構(gòu)可能是實現(xiàn)通用人工智能( AGI )的關(guān)鍵。但還需要些時日。
當前主要的芯片制造商和一些初創(chuàng)公司,正在研發(fā)脈沖神經(jīng)網(wǎng)絡(luò)的專用芯片,針對 CNN 和 RNN 的進行了優(yōu)化,其中一些還針對極低功耗做了優(yōu)化。
這些功能結(jié)合在一起,會將深度學習轉(zhuǎn)移到網(wǎng)絡(luò)邊緣的芯片上。從今年開始,對于物聯(lián)網(wǎng)和其他流媒體數(shù)據(jù)應(yīng)用,會怎樣被點燃,就拭目以待吧。
預(yù)測5:不同的 AI 框架將相互融合
目前文本,語音,圖像和視頻模型已發(fā)展成了主流,但發(fā)展還是遇到了很大的障礙。因為在一個框架(如Caffe2,PyTorch,Apache MXNet,Microsoft Cognitive Toolkit 和 TensorFlow )上構(gòu)建的模型,無法輕松移植到另一個框架。
幸運的是,這也推動了一些創(chuàng)新之舉。比如 AWS,Facebook 和 Microsoft 合作構(gòu)建的開放式神經(jīng)網(wǎng)絡(luò)交換平臺( ONNX ),使模型可以在不同的框架上實現(xiàn)互操作。
隨著開發(fā)人員,應(yīng)用程序和設(shè)備之間共享的模型數(shù)量增多,ONNX 將會是今年的一項關(guān)鍵技術(shù)。
這就是對今年情況的一個預(yù)測。就等著明年的時候回過頭來,看看這個領(lǐng)域和所想的有什么不同。
總結(jié)
以上是生活随笔為你收集整理的对 2018 年 AI 发展预言全中,他们又立了 2019 的 Flag的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一次线上内存报警的研究
- 下一篇: 设置Grid某列的Title样式和列内数