阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力
第一屆“英特爾創新大師杯”深度學習挑戰賽已在阿里云天池平臺如火如荼的進行中。本次大賽由英特爾主辦,阿里云計算平臺機器學習 PAI 聯合達摩院以及中文信息協會等組織機構聯合承辦,共有近 7500 支隊伍報名參賽,并取得了優異的成績。
阿里云天池平臺是業界領先的科技眾智平臺,旨在打造“數據眾智、眾創”的第一平臺,此次舉辦的“英特爾創新大師杯”深度學習挑戰賽則是聚焦在當下火熱的計算機視覺 OCR 領域以及自然語言處理 NLP 領域的經典技術方向,希望通過比賽引導開發者們找到更創新優化的技術解決方案,促進 AI 行業開發者們的技術交流。本次比賽的參賽選手中不僅有來自國內外各個企業的代表,也有很多來自國內知名高校的年輕選手,包括:北京大學,復旦大學,浙江大學,華北電力大學,重慶理工大學,中國海洋大學,北京科技大學,北京交通大學,華中科技大學,西安電子科技大學,四川大學等等。?
在現實場景中文字是人們生活中必不可少的部分,我們每天都在生活和工作中處理不可計數的文字信息,例如:書本中的文字,海報中的文字,票據中的文字等等。本次比賽 OCR 賽道的任務旨在解決這類光學文字的提取問題:如何將現實場景中出現的文字信息,更準確的轉化為電子設備可以處理的文本信息,以滿足人們在不同行業應用中的需求。?
此外,地址也是日常生活中一種重要且常用的文本信息,像是汽車導航、電商購物、快遞配送、人口普查、水電氣開戶等都需要我們用到地址信息。常見的地址可能會包含行政區劃信息,如省、市、縣、鄉鎮的信息;也有可能會包含路網信息,如路名,路號,道路設施等; 智能地址要素解析可以將地址文本拆分成獨立語義的要素,并對這些要素進行類型識別的過程。而智能地址文本相關性服務更可以幫助人類根據不同形式的地址表述來快速搜索定位到準確的地址。?
本次“英特爾創新大師杯”深度學習挑戰賽正是由“通用場景 OCR 文本識別任務”、“NLP 地址要素解析任務”和“NLP 地址相關性任務”三個賽道組成,參賽選手可以自由報名參加任何賽道,發揮自己的算法技術和創造力,探索中文語義 AI 技術在各類日常生活實用場景中的應用。?
值得一提的是,本次參賽的開發者可以在阿里云天池實驗室提供的交互式建模平臺 PAI-DSW 上進行模型訓練。PAI DSW(Data Science Workshop)由阿里云機器學習平臺 PAI 于 2018 年針對算法開發人員推出的云端機器學習編程環境,在已有 PAI Studio 提供的組件化拖拉拽式模型訓練服務的基礎上,提供了更具靈活性和自主性的模型開發和訓練。PAI DSW 在集成 JupyterLab 的基礎上,內置了豐富的數據開發和機器學習算法庫,并為天池參賽選手提供了多種免費的計算資源,包括當下主流的 CPU 和 GPU。?
事實上,“英特爾創新大師杯”深度學習挑戰賽只是 PAI 和 Intel 合作的一個縮影。PAI 和英特爾合作貫穿了從硬件至驅動再到軟件,第七代高主頻實例包括了英特爾至強處理器,為機器學習平臺提供了非常大的優化空間,例如在互聯網行業,不管是在內容推薦、廣告推薦、商品推薦這些領域,把內容信息轉換成特征信息,需要使用非常多的自然語言處理技術,英特爾產品 DL boost 能夠大幅提升 NLP 的效率,推升我們在公共云客戶以及專有云客戶使用平臺的性價比。CPU 硬件上集成了 BF16 加速指令能夠大幅度提升 PAI 訓練平臺加速的效率,同時 AVX-512 指令集提供通用的底層算子。軟件搭配英特爾? oneAPI 深度神經網絡庫(oneDNN)非常容易集成,降低優化和使用門檻。?
PAI 和英特爾在 AI 領域的合作,可以說是一次成功的強強合作。英特爾對于自己硬件性能的理解以及我們對于在模型上面對訓練對場景的理解,形成一個更好的聯動,把 AI 自動化能夠做起來,我們的用戶更加隨心所欲地進行模型的變化。雙方合作具備領先性,能夠推動業界標準的提高,在 benchmark(全球 AI 性能榜單)上進一步去發布結果,推動整個 CPU 平臺工作的演進。?
從英特爾和阿里云 PAI 的合作也可以窺探出整個 AI 技術的發展趨勢在向智能化、自動化以及工程化發展。Gartner 將「AI 工程化」列為 2021 年度九大重要戰略科技趨勢之一。AI 要成為企業生產力,就必須以工程化的技術來解決模型開發、部署、管理、預測等全鏈路生命周期管理的問題。?
針對 AI 工程化落地的實踐經驗,阿里云認為模型超大規模化是非常重要的一個基礎能力。2021 年初,阿里云機器學習 PAI、達摩院智能計算實驗室聯合清華大學共同開發了業界最大規模的中文多模態預訓練模型 M6。PAI 團隊自研 Whale 分布式訓練框架,在計算效率、通信效率、顯存消耗等多個方面進行了深度優化,從而幫助 M6 模型快速迭代訓練。?
基于機器學習平臺 PAI,阿里云希望構建大規模 AI 端到端的能力,從底層芯片到分布式系統,再到上層算法和數據的規模化,打造 AI 工程化集團作戰的能力,服務于各行各業。?
點擊閱讀原文查看大賽主頁
總結
以上是生活随笔為你收集整理的阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 系统安装怎么启动u盘安装win7系统 使
- 下一篇: win10怎么设置驱动器 设置Win10