微软发10项新品!28.5万个核心的AI超算机,最大语言模型开源
原標題:昨夜,微軟甩出 10 項硬核新品!28.5 萬個核心的 AI 超算機,最大語言模型開源
文/韋世瑋、董溫淑
來源:智東西
看點:微軟砸 10 億美元扶持的超算來了,一文看盡昨夜 Build 大會十大看點!
智東西 5 月 20 日消息,昨晚,一年一度的微軟 Build 開發者大會拉開序幕。與往常不一樣的是,大會的舞臺從往年的美國西雅圖搬到了線上,同時發布的新產品和新升級也幾乎面向開發者,成為開發者們的“獨家盛宴”。
毫不意外,今晚大會仍以微軟現任 CEO 薩蒂亞·納德拉(Satya Nadella)的主題演講作為開場。在短短的 20 多分鐘演講中,“開發者”、“Azure”、“Microsoft 365”和“Windows”等關鍵詞貫穿全場,尤其是“開發者”。
他談到,目前 GitHub 上的開發者已超過 5000 萬人,Power Platform 上的開發者也超過了 350 萬人。而微軟也將為開發者提供一系列提高工作效率的開發工具和解決方案,進一步提升生產力。
圍繞開發者,本次微軟 Build 大會的核心亮點如下:
1、宣布與 OpenAI 合作開發的 AI 超級計算機,專門用于訓練大規模分布式 AI 模型。
2、推出面向醫療行業的 Microsoft Cloud for Healthcare,提升醫療護理團隊的協作、決策和操作效率。
3、推出針對工業系統的 AI 開發平臺 Project Bonsai,以及 Project Moab 實驗平臺。
4、推出 Windows 開發者平臺 Project Reunion,統一 UWP 和 Win32 的現有 API。
5、升級 DeepSpeed 庫,主要面向深度學習領域,并開源史上最大語言模型——微軟圖靈模型。
6、發布 Azure Synapse Link,可對實時運營數據進行分析。
7、WSL 2 新增特性,包括對 GPU、Linux GUI 應用程序的支持,以及簡化安裝體驗。
8、推出 Microsoft Teams 平臺功能更新,包括為開發人員提供流線型體驗。
9、開源并升級 Fluid Framework,提供 Fluid 組件和 Fluid 工作區。
10、提供負責任的機器學習工具,以減少不公平性。
除此之外,微軟推出命令行界面 Windows Package Manager,幫助開發者快速搜索、查看和安裝各類管理工具。同時,微軟 Chromic 內核的瀏覽器 Edge 也新增了側邊欄搜索、同步等新功能。
值得一提的是,微軟還宣布收購機器人流程自動化(RPA)創企 Softomotive,以將 RPA 技術引入 Power Automate。
AI 超級計算機亮相,針對大規模分布式 AI 模型訓練
2019 年 7 月,微軟宣布向人工智能研究實驗室 OpenAI 投資 10 億美元,以共同構建一個新的 Azure AI 超算平臺,將主要用于訓練和運行更加先進的 AI 模型,其中包括基于微軟 Azure AI 超算技術。同時,這筆投資也將進一步幫助 OpenAI 開發 AGI(通用人工智能)技術。
歷時一年,這臺超級計算機終于在今晚亮相,主要用于大規模分布式 AI 模型訓練。
微軟聲稱,這臺超級計算機的性能位列全球前五,共包含 28.5 萬個 CPU 核心和 1 萬個 GPU,每個 GPU 網絡帶寬為 400Gb/s。
由于在 Azure 中托管,這臺超級計算機已經能夠實現一系列現代云基礎架構的功能,包括快速部署、可持續的數據中心,以及對所有 Azure 服務進行訪問。
經研究人員實驗,該超級計算機已經能夠實現大規模 AI 模型訓練,可深入了解語言語法、知識概念和上下文內容的細微差別。同時,它還可以總結冗長的對話、在實時游戲中進行適度對話、解析復雜的法律文件,甚至通過搜索 GitHub 生成代碼。
目前,微軟已使用圖靈模型來改善 Bing、Office、Dynamics 和其他生產力產品的語言理解功能。例如,在 Bing 中,該模型生成文字和回答問題的速度提高了 125%。
微軟表示,其將通過 Azure AI 服務和 GitHub,進一步將大規模 AI 模型、訓練優化工具和超級計算機資源釋放出來,讓開發者、數據科學家和商業客戶都能輕松利用 AI 的力量。
Microsoft Cloud for Healthcare:提升醫療護理效率
在微軟看來,今年新型冠狀病毒疫情的大流行幾乎影響了人們生活的方方面面,同時也阻礙了醫療保健業務的正常運行,大大降低了患者治療和護理的效率。
針對這一問題,推出了其首個針對特定行業的云產品——Microsoft Cloud for Healthcare,支持微軟 Teams 中的新 Bookings 應用程序,護理人員能夠在 Teams 中安排、管理和進行患者的虛擬就診,并提供相應服務,進一步增強患者溝通、護理團隊的協作和管理效率。
與此同時,用戶還可以使用 Microsoft Cloud for Healthcare 來擴展 Microsoft Dynamics 365 Marketing、Dynamics 365 客戶服務和 Azure IoT 價值,以進行患者體驗、醫生轉診管理、患者檢測等部署。
其中,基于 Microsoft Cloud for Healthcare 擴展的 Microsoft Healthcare Bot 服務,自今年 3 月以來已有超 1600 個 COVID-19 機器人實例投入使用,服務了 23 個國家的 3100 萬人,進一步減輕相關疾病預防控制中心的緊急熱線壓力。
工業系統 AI 開發平臺 Project Bonsai
簡單地說,Project Bonsai 是一個用于構建自主工業控制系統的 AI 平臺,也是一項“機器教學”服務,它結合機器學習、校準和優化功能,能夠為制造、化工、建筑、能源和采礦等行業機械的核心控制系統提自主化,以更好地管理各類工業設備。
Project Bonsai 通用強化學習平臺能夠協調 AI 模型的開發,為 AI 模型的部署和訓練提供了針對算法和基礎設施的訪問,允許模型在本地、設備或云上部署,并支持 MATLAB Simulink、Transys、Gazebo 和 AnyLogic 等模擬器。
此外,用戶能夠在 Project Bonsai 的儀表盤上查看所有工作和訓練狀態,對模型進行調試、檢查和改進。同時,Project Bonsai 還支持多用戶協作構建和部署新模型。
與此同時,針對想要嘗試 Project Bonsai 的工程師和開發者,微軟還開發了一款名為 Project Moab 的硬件設備。
它是一個具有三個手臂、一個操縱桿控制器的機器人,能夠讓一顆小球在頂部的透明板上保持平衡。該工具為用戶提供了一個模擬環境,讓用戶借助模擬器進行實驗。
Project Reunion:統一 Windows 應用生態平臺
微軟此次推出 Windows 開發者平臺 Project Reunion,主要目的就是在于統一 Windows 的應用生態平臺,通過融合 Universal Windows Platform(UWP)和 Win32 的現有 API,讓開發者能夠擺脫不同操作系統之間的限制,輕松實現跨平臺開發。
微軟將在兩者間添加更多通用的 API 和可互操作代碼。這將為應用程序提供一個通用平臺,幫助用戶使用最新功能更新,以及現代化現有應用程序,無論是C++、.NET(包括 WPF、Windows Forms、UWP),還是 React Native。
此外,微軟還面向企業用戶推出了 Windows Terminal 1.0,能夠讓用戶在多個選項卡和窗格中運行任何命令行可執行文件,包括 WSL 發行版和 Azure Cloud Shell。
DeepSpeed 庫升級,微軟圖靈模型開源
早在今年 2 月,微軟發布了 DeepSpeed 的開源版本,并同步推出了 ZeRO(零冗余優化器)。
DeepSpeed 主要為跨多臺服務器進行分布式模型訓練而設計,ZeRO 是一種將大型模型擬合到內存中的技術,通過減少數據并行中的內存冗余以實現結果。
ZeRO-1 包含模型狀態內存優化,ZeRO-2 則提供了激活內存和碎片內存的優化。同時,ZeRO-2 還針對單個 GPU 上的訓練模型進行了改進。據悉,ZeRO-2 訓練模型的速度比谷歌 BERT 提升 30%。
微軟表示,ZeRO 的內存優化技術能夠訓練具有 170 億個參數的機器學習模型,如擁有 170 個參數的微軟圖靈模型,它是目前世界上最大的語言 AI 模型,主要用于自然語言生成(NLG)。
值得一提的是,微軟宣布將在短期內開源微軟圖靈模型,以及在 Azure 機器學習中訓練它們的方法。DeepSpeed 庫的升級,也將讓開發者能夠使用 ZeRO-2 來訓練大型神經網絡。
Azure Synapse Link:可對實時運營數據進行分析
Azure Synapse Link 能夠讓用戶通過 Azure Synapse Analytics 中的實時操作數據,直接獲得分析結果,無需進行提取、轉換或加載步驟。同時,它還能將實時數據與現有的分析存儲庫結合,以獲得相關業務的整體視圖。
此外,Azure Synapse Link 可以在 SQL 行的指導下以“PB 級”速度查詢數據,具有智能工作負載管理和并發功能,可以實時優化查詢性能。
在安全性方面,Azure Synapse Link 具有自動威脅檢測和始終在線數據加密功能,具備動態數據屏蔽、細粒度訪問控制和列級/行級安全性。
據悉,Azure Synapse Link 最初將在 Azure Cosmos DB 中發布,但很快就會應用到所有的操作系統中,進一步幫助開發者降低成本并減少時間。
WSL 2 新增對 GPU、Linux GUI 應用程序的支持
WSL 2 新增幾項特性,包括對 GPU、Linux GUI 應用程序的支持,以及簡化安裝體驗。
一方面,WSL 2 支持 GPU 計算工作流,使 Linux 工具能夠利用 GPU 為一系列開發場景進行硬件加速,例如并行計算、訓練 AI 和機器學習模型。該功能將在今年下半年正式更新。
另一方面,WSL 2 將支持 Linux GUI 應用程序,允許用戶在打開一個 WSL 實例時直接運行 Linux GUI 應用程序,無需第三方服務器。
今年晚些時候,WSL 2 將支持簡化安裝體驗。屆時,開發者能夠簡單地運行“wsl.exe -install”命令并重新啟動。
Microsoft Teams 平臺功能
在疫情期間,Microsoft 365 核心組件 Microsoft Team 智能會議平臺的使用量出現了大幅度的增長。
今年 4 月,Satya Nadella 談到,Microsoft Team 的單日參會量已超過 2 億,產生了超過 41 億分鐘的會議記錄。此外,目前 Teams 每天有超過 7500 萬活躍用戶,其中有三分之二的用戶在 Teams 上進行文件共享、協作或交互。
因此,微軟針對線上會議的龐大需求,對 Microsoft Teams 進行一系列功能更新,其中包括擴展 Visual Studio 和 Visual Studio Code,讓開發者能使用自己熟悉的工具對 Teams 應用進行開發;提供 Power Virtual Agents bot,消除在 Teams 中使用 Power Virtual Agents bot 時,用戶重復登錄的需要等。
開源并升級 Fluid Framework
2019 年,微軟推出了協作平臺 Fluid Framework,它能幫助用戶更好地進行協作,并增強共享互動體驗。
在今晚的大會上,微軟宣布將開源 Fluid Framework,同時還針對其協作形式進行一系列升級,主要體現在 Outlook 和 Office.com 中。
一方面,用戶可以在網頁版 Outlook 中插入圖表、任務列表等,使用戶的銷售數據、項目任務和研究報道等資料保持實時更新;
另一方面,用戶可創建和管理 Fluid 工作區,如文檔活動源和推薦列表,或在 office.com 中進行搜索。由于 Fluid Framework 組建是輕量級的,因此用戶可即時編輯。
提供負責任的機器學習工具
微軟人工智能平臺副總裁埃里克·博伊德(Eric Boyd)曾指出,如今越來越多的開發人員都被要求構建一個易于解釋,且符合非歧視和隱私法規的 AI 系統。
基于此,微軟決定在 Azure 機器學習和 OSS 工具包中發布負責任的機器學習工具,通過改善模型的可解釋性來減少不公平性,并確保數據隱私和機密性,進一步幫助開發者更負責任地部署 AI 模型。
一方面,它通過將 Fairlearn 與 Azure 機器學習結合使用,讓開發者和數據科學家可利用專門的算法來確保每個人都擁有更公平的結果。
另一方面,它通過將新的 WhiteNoise 差異隱私工具包與 Azure 機器學習結合,讓數據科學團隊能夠構建機器學習解決方案,在保護隱私的同時防止個人數據的重新標識。
此外,為了實現安全的模型訓練和部署,Azure 機器學習還提供數據和網絡保護功能。其中,包括對 Azure 虛擬網絡的支持、用于連接機器學習工作區的專用鏈接,以及客戶管理密鑰等。
結語:一場面向開發者的技術盛宴
從今晚微軟 Build 大會的發布看,微軟越來越重視開發者的體驗,在為開發者提供越來越便捷和豐富的開發工具時,也更強調他們身上所擔起的責任和義務。
其中,微軟與 OpenAI 合作開發的 AI 超級計算機面世、首次面向專業領域推出的 Azure 服務、針對工業系統的 AI 開發平臺 Project Bonsai、UWP 和 Win32 的統一,以及微軟圖靈模型等重磅產品推出和升級,無疑展現了微軟與開發者之間的彼此依賴、彼此賦能。
隨著全球各行各業的數字化轉型熱潮鋪開,微軟又將如何在這個過程中進一步探索自己與開發者、與 AI 技術、與產業之間的合作與未來?時間會告訴我們答案。
總結
以上是生活随笔為你收集整理的微软发10项新品!28.5万个核心的AI超算机,最大语言模型开源的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 车载导航的导航卡一般在哪里
- 下一篇: 首批国产特斯拉Model3长续航版交付