腾讯Angel成世界顶级AI项目!中国首个从LF AI基金会的毕业项目
北京時間 12 月 20 日,Linux 基金會旗下面向 AI 領域的頂級基金會——LF AI 基金會(Linux Foundation Artificial Intelligence Foundation)正式宣布,騰訊開源項目 Angel 從 LF AI 基金會畢業,也是中國首個從 LF AI 基金會畢業的開源項目。這意味著,Angel 得到全球技術專家的認可,成為世界最頂級的 AI 開源項目之一。
LF AI 基金會執行總監 Ibrahim Haddad 表示:“在 Angel 從孵化到畢業的過程中,我們能看到 Angel 在新功能完善和應用場景落地方面驚人的速度。隨著 3.0 版本的發布,Angel 在功能、適用性和對社區的貢獻等都有了非常優秀的表現。這也是整個 AI 開源社區在走向成熟并具備工業級生產能力的方向上邁出了一大步。”
Angel 是騰訊的首個 AI 開源項目,于 2016 年底推出、2017 年開源。作為面向機器學習的第三代高性能計算平臺,Angel 致力于解決稀疏數據大模型訓練以及大規模圖數據分析問題。騰訊在 2018 年成為 LF AI 基金會的創始白金會員之一,并于同年向基金會貢獻了開源項目 Angel。
騰訊云副總裁、騰訊數據平臺部總經理蔣杰表示:“騰訊致力于通過開源代碼,與開發者共建開源生態、實現成果共享,已成為大數據領域開源最為全面的公司。我們很高興看到 Angel 從 LF AI 基金會成功畢業,在基金會的指導和開發者的共建下,完成從單一的模型訓練平臺到全棧機器學習平臺的技術跨越,這也與騰訊大數據批流融合、ABC 融合的未來發展方向緊密契合。畢業是 Angel 新的開始,未來我們將進一步開放 Angel 在圖計算和聯邦學習領域的核心能力。”
據 LF AI 基金會董事、騰訊 AI 專家肖涵介紹,LF AI 基金會對開源項目的畢業流程有非常嚴格的規定,基于項目的技術含量、開源生態、社區互動等維度,嚴格評估項目的成熟度,最終由董事會投票決定能否準予畢業。能夠從 LF AI 畢業,意味著項目已經得到全球技術專家的認可,成為最頂級的 AI 開源項目。
Angel 在基金會的孵化過程中獲得了快速發展,并完成了從 2.0 版本到 3.0 版本的跨越,從一個單純的模型訓練系統進化成包含從自動特征工程到模型服務的全棧機器學習平臺。
LFAI & AngelAngel 的特征工程模塊基于 Spark 開發,增強了 Spark 的特征選擇功能,同時使用特征交叉和重索引實現了自動特征生成。這些組件可以無縫地整合進 Spark 的流水線。為了讓整個系統更加的智能,Angel 3.0 新增了超參數調節的功能。
在模型服務方面,Angel 3.0 提供了一個跨平臺的組件 Angel Serving,不僅可以滿足 Angel 自身的需求,還可以為其他平臺提供模型服務。在生態方面,Angel 也嘗試將參數服務器(PS)能力共享給其他的計算平臺,目前已經完成了 Spark On Angel 和 PyTorch On Angel 兩個平臺的建設。
Angel 的特征工程模塊基于 Spark 開發,增強了 Spark 的特征選擇功能,同時使用特征交叉和重索引實現了自動特征生成。這些組件可以無縫地整合進 Spark 的流水線。為了讓整個系統更加的智能,Angel 3.0 新增了超參數調節的功能。
平臺提供模型服務。在生態方面,Angel 也嘗試將參數服務器(PS)能力共享給其他的計算平臺,目前已經完成了 Spark On Angel 和 PyTorch On Angel 兩個平臺的建設。
圖計算體系架構在 3.0 版本中,Angel 重點研發了圖機器學習功能,包括圖表示和圖神經網絡學習模型,同時提供預處理、圖挖掘等端到端數據處理能力,具有豐富的算法庫,提供了同構圖、異構圖多種圖計算范式和不同種類的圖算法。經過騰訊內部業務的大規模實踐,Angel 在圖算法性能上同樣表現出眾,例如十億節點、千億邊規模的圖結構,運行算法時能以 Spark GraphX 三分之一的計算資源,達到十倍處理性能。
圖計算性能對比除了技術功能上的完善,Angel 在社區生態上也日趨成熟。據了解,在全行業 Angel 擁有超過 100 家公司和機構用戶,其中包括微博、華為、微眾銀行、小米、滴滴等大型互聯網企業。基于 Angel 構建的一站式機器學習應用平臺智能鈦 TI,支持了包括微信支付、騰訊廣告、微視等在內的諸多騰訊內部產品,同時也通過騰訊云對外開放為更多行業企業提供服務。
截止目前,Angel 在 GitHub 上已經獲得了 5500 Star,1400 Fork,在技術、應用、生態等方面的優秀表現均得到了開源社區的認可。此前在騰訊 2019 Techo 開發者大會上,蔣杰還宣布了資源管理平臺核心 TKE 和分布式數據庫 TBase 的正式開源。騰訊正在成為大數據領域開源最全面的公司。
開源協同是當前騰訊最重要的技術戰略之一。在今年的重慶智博會上,騰訊公司董事會主席兼首席執行官馬化騰專門提及了對開源的重視,他表示,騰訊希望在科研領域投入更多力量,將通過內外部開源等方式,積極參與“全球科技共同體”的共建。
截止 2019 年 11 月,僅在 Github 上,騰訊就開源了 91 個項目,有超過 1000 個貢獻者參與,獲得超過 26 萬個 Star 數,在 Github 全球公司貢獻榜上居于前列。騰訊還加入了 Linux、Apache 等 9 大開源基金會,并成為最高級別會員。其中 LF AI 基金會是由 Linux 基金會發起的人工智能領域的專項開源基金會,旨在倡導和組織 AI 開源平臺和工具共同參與建設,共同享有 IP 知識產權,創建可持續發展的開源 AI 生態系統。
2018 年,騰訊因在 AI 開源領域的卓越技術影響力,受邀作為 LF AI 基金會的初始白金會員加入,擁有董事會和技術咨詢委員會席位,并于同年向基金會捐贈高性能分布式機器學習平臺 Angel。
總結
以上是生活随笔為你收集整理的腾讯Angel成世界顶级AI项目!中国首个从LF AI基金会的毕业项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入浅出理解 Spark:环境部署与工作
- 下一篇: 腾讯云TStack获“下一代云计算技术创