阿里云容器服务多项重磅发布:高效智能、安全无界的新一代平台
在云原生帶來的云計算未來趨勢下,容器已經成為用戶使用云的新界面。
阿里云容器產品發布近 7 年以來,已成長發展為企業的云原生操作系統,技術和服務能力日趨成熟,但創新從未止步。日前,阿里云研究員 & 云原生團隊負責人丁宇在阿里云計算峰會上宣布容器服務 ACK 全面升級 ACK Anywhere,這一重要升級意味著 ACK 有能力在企業任何需要云的地方,提供統一的容器基礎設施能力。
2021 年 10 月 21 日,在云棲大會·云原生峰會現場,阿里云資深技術專家、容器服務負責人易立深度分享了阿里云在容器技術領域的最新進展與探索,以及 ACK Anywhere 背后的思想及落地能力,同時宣布多項重要升級和全新發布,使阿里云容器服務全面發展為高效、安全、智能、無界的下一代云原生操作系統。
易立,阿里云資深技術專家、容器服務研發和產品負責人
跨越鴻溝,容器加速云原生普惠
阿里云對云原生的定義是“應云而生”的軟件、硬件和架構。容器技術和服務可以為企業業務發展帶來三大核心價值:
-
敏捷高效。通過容器可以更好的支持 DevOps,優化研發和交付流程,同時提升應用的彈性與資源效率,使企業 IT 架構從容應對環境變化,降低計算成本;
-
加強韌性。容器可以降低用戶遷云成本,同時更好地支撐微服務應用架構的部署與交付,使基礎設施和應用架構具備更強的韌性,更好地保護業務的連續性;
-
加速融合創新。越來越多的新技術,如 5G、AIoT、AR/VR 等,正在加速數字世界跟物理世界的融合。而無處不在的容器技術能夠加速這樣的融合計算新形態。
阿里云容器服務支撐了集團 100% 應用的云原生化,同時為云上上萬企業實現現代化應用改造升級提供升級服務。從互聯網到零售、金融、制造、交通,越來越多的行業在利用創新的云原生技術解決他們的業務問題。與此同時,容器也在支撐著更多行業場景創新,比如在智能駕駛領域,仿真模擬需要海量的算力。只有云計算與云原生技術能夠滿足業務算力的彈性、規模和效率的需求。
六大升級,釋放容器技術極致潛能
優化資源調度能力,全面支持新一代云原生芯片
阿里云今年重磅發布第 7 代彈性計算實例,覆蓋了從 Intel、AMD 到 ARM 全新一代云原生芯片,使單節點計算密度持續提升、單核計算成本持續下降。另一方面,隨著應用部署密度增加,必然帶來應用對 CPU 資源的爭搶、跨 NUMA 內存訪問等問題持續嚴重,導致計算效能降低。
為此,阿里云容器服務 ACK Pro 針對新一代云原生芯片優化了資源調度,可以更好地根據芯片核心架構優化進程和布局,提升緩存命中率,降低跨 NUMA 內存訪問,在內存密集型場景下實現 20% 至 30% 的性能提升。
同時,阿里云容器服務正在與 Intel 合作,共同打造軟硬一體化的資源隔離保障方案,通過引入 RDT,HWDRC 等技術可以根據應用的 QoS 動態調整 L3 緩存帶寬,將低優先級任務對高優先級任務的影響控制在 5% 以內,讓多種應用負載的混布具備更高穩定性。
軟硬協同、一體優化的新一代容器網絡平面
阿里云容器網絡 Terway 帶來全新一代容器網絡平面升級。通過與阿里云洛神網絡深度融合,基于神龍芯片 offload 虛擬化網絡開銷,并在 OS 內核中通過 eBPF 實現容器 Service 轉發和網絡策略,真正實現零損耗、高性能。相比Flannel等開源容器網絡方案,在小包壓測場景中 Terway 吞吐量提升 30%,報文延遲下降 50%。
此外,新一代 Terway 內置全鏈路網絡可觀測能力,通過 eBPF 技術,使用戶無需安裝任何插件即可實現對容器網絡的全面可視化。
IPv6 已成為國家互聯網技術升級戰略的重要組成部分,阿里的容器網絡聯合洛神網絡相集成,實現了完整的 IPv6 雙棧解決方案,能夠在同一容器集群中同時實現 IPv4 和 IPv6 兩種不同的網絡協議棧,做到平滑升級,也能進一步簡化混合云的網絡互聯。
智能、高效的新一代資源調度Cybernetes
企業正在將越來越多的工作負載運行于 Kubernetes 之上,微服務、AI、大數據等多樣化應用對資源提出多樣化需求。同時,云上算力日益豐富,從面向通用計算的 CPU,到面向 AI 高性能計算的 GPU、NPU,算力層出不窮,這些都對容器化資源控制、隔離和調度能力提出新挑戰。
為此,阿里云容器服務帶來全新升級的資源調度器 Cybernetes,為開源 Kubernetes 提供能力增強。以數據驅動的方式,根據應用運行時資源畫像實現智能化調度和實時調整,簡化了應用資源配置的復雜性,有效提升了運行時穩定性,降低資源成本。
Cybernetes 具備三個關鍵特征:
- 全兼容:基于 Scheduler framework,與上游調度實現 100% 兼容;
- 全場景:在同一個調度器上同時支持不同工作負載,真正帶來良好的資源混布;
- 智能化:依賴于阿里云資源調度領域 10 年技術沉淀,用戶只需聲明所需 SLO,即可由系統智能化地實現 SLO 保障。
通過內部支撐驗證,相比開源實現,Cybernetes 在 AI 和大數據應用場景的調度性能可實現 300% 的提升,在保證業務穩定運行的同時讓資源成本下降 50%。
云原生 AI 套件升級,全棧優化 AI 效能和成本
隨著企業對數據化和智能化的重視,越來越多的企業希望利用 Kubernetes 來運行 AI 和大數據應用,能夠更好地實現技術棧的統一、資源池和技能棧的統一。
阿里云針對大規模 GPU 的管理、調度和 AI 容器最佳實踐,推出 ACK 云原生 AI 套件,基于 Kubernetes 全棧優化 AI 性能、效率和成本,助力用戶快速構建 AI 平臺:
- 通過 GPU 共享,在模型預測場景實現 100% 的 GPU 利用率提升;
- 在訓練場景,通過分布式緩存加速,GPU 拓撲感知,使模型訓練任務加速 20%;
- 通過云原生 AI 任務流,使 AI 工程效率整體提升 50%。
容器智能化運維體系
Kubernetes 的復雜性是阻礙很多客戶采用的一個重要因素,尤其是在使用過程中遇到問題的時候,需要具備大量專業知識背景才可進行排查。為讓企業更簡單地使用和運維 Kubernetes 系統,ACK 構建了完備的容器智能運維體系——
-
國內首個全托管節點池:全托管節點池除了具備自動彈性伸縮能力,也可以自動完成節點升級、CVE 修復、節點自愈等操作,讓用戶不用再操心 Kubernetes 節點管理的問題。
-
零侵入、低損耗的容器監控:可觀測是云原生的核心能力。ARMS 容器監控基于 eBPF 提供無侵入、低損耗的容器資源和應用監控能力。
-
統一的成本優化、事件告警和安全治理:ACK 今年也發布了成本中心、事件中心、安全中心,為公共云、混合云客戶提供精細化且統一的成本管理、事件告警和安全治理能力。
-
智能化診斷能力:基于阿里云容器團隊在 Kubernetes 上大規模實踐,利用數據化,智能化技術對典型 Kubernetes 問題進行自動診斷,給出修復方案。目前包含 100+ 診斷項,覆蓋節點、容器、網絡等超過 80 個場景,幫助企業及時處理線上問題,同時,對集群中的穩定性風險進行巡檢,防患于未然。
容器鏡像服務企業版 ACR EE 正式商業發布
ACR EE 是企業的云原生資產管理平臺,面向安全需求高、分發性能需求高的容器企業級場景,如互聯網企業出海、跨國公司協作、在線教育、游戲等公司,提供云原生制品安全托管、高效分發的企業級解決方案,包括:
-
支持多種 OCI 制品托管,包括多架構容器鏡像(Linux、Windows、ARM 等架構的容器鏡像)、 Helm Chart、AI 模型等符合 OCI 規范的制品管理;
-
推出了對 X86/ARM 多架構鏡像的自動構建能力,簡化應用對多樣化算力的適配;并提供阿里云官方認證的容器鏡像,比如 JDK 和 AI 鏡像,為應用提供帶來可信和高效的基礎鏡像實現;
-
完善鏡像分發加速能力:同時支持 ECS/ECI 千節點并發拉取,并將鏡像分發加速拓展至邊緣云、企業數據中心;
-
云原生應用交付鏈,全面擁抱 DevSecOps 理念,在容器軟件供應鏈中,對安全風險進行自動化分析、修復和阻斷。
三大核心發布,落地 ACK Anywhere 拓展云計算邊界
阿里云今年宣布了“一云多形態”的部署架構,能夠讓一朵飛天云運行在從核心地域到用戶數據中心的各個業務場景,為企業帶來本地化、低延遲的公共云能力。ACK Anywhere 應運而生,進一步拓展云的邊界,在企業任何需要云的地方,提供統一的容器基礎設施。
ACK Anywhere 現在已經提供對中心云、本地云、邊緣云、云盒等公共云形態的全覆蓋能力,以及包含專有云企業版、敏捷版等的多種本地部署形態。此外,不久前發布的ACK 發行版可以部署在客戶 IaaS 之上,被公共云統一納管。
此次云棲大會上的三大核心發布,將近一步落地 ACK Anywhere 拓展云計算邊界能力。
ACK ONE——容器融合管理平臺
ACK ONE 的價值理念是“云生萬物,萬物歸一”。基于阿里云提供的多云、多集群、多環境管理能力,ACK ONE 能夠同時管理阿里云上集群、邊緣集群、部署在用戶客戶中心的集群以及其他云上的 Kubernetes,真正實現集群的統一管理、資源的統一調度、數據的統一容災和應用的統一交付。
當企業遇到業務突發流量時,利用 ACK ONE 提供的彈性可以快速向云上擴容;此外,利用 ACK ONE 企業可以同時管理分布不同地域的 Kubernetes 集群,實現統一的資源調度,根據集群實際的空閑狀態將業務應用分發到不同集群上執行,充分提升資源利用率。
ACK 備份中心——數據備份、容災、遷移一體化解決方案
ACK ONE 上提供了數據的備份、容災和遷移一體化解決方案,幫助企業實現多地域、混合云的數據容災架構。
在阿里云上利用 ACK 構建自己的數據庫管理平臺的企業,通過 ACK ONE 備份中心可以對數據盤進行定時的數據拍照,支持 TB 級數據的分鐘級備份與恢復,同時支持單機多盤的一致性保障。這些能力極大地提升了數據的整體穩定性。
邊緣云原生一體機——軟硬一體化的云邊協同解決方案
邊緣云原生一體機是依托于阿里云邊緣容器服務 ACK@Edge 的云邊端一體協同、軟硬一體優化的解決方案,具備多樣化的硬件規格,可以部署在用戶現場,實現實時、穩定的近場計算能力。利用 ACK@Edge 提供的設備孿生能力,我們可以將通過公共云利用云原生的方法,對海量的分布式的邊緣設備和應用進行統一的管理。
以停車場景為例,企業可以基于邊緣云原生一體機構建智能化的停車管理系統,對路內泊位車輛的駛入駛離進行智能化識別,并且將視頻和照片作為證據鏈保存在云端,實現停車管理智能化、無人化。
攜手同行,未來可期
得益于社區的力量,阿里云云原生和容器技術快速發展。作為國內云原生開源的領導者,阿里云云原生已向 CNCF 云原生基金會貢獻 9 個項目,覆蓋邊緣計算、機密計算、混沌工程等不同領域。
源于社區,阿里云容器服務也與更多技術伙伴展開合作,比如與 Intel、VMware 在機密容器、沙箱容器、云原生邊緣計算等方向的共建,同時積極推進在阿里云的產品化落地。
阿里云容器服務期待與更多優秀合作伙伴、企業共同探索云計算的未來,構建高效安全、智能無界的新一代云原生基礎設施,助力企業加速云時代的技術創新。
總結
以上是生活随笔為你收集整理的阿里云容器服务多项重磅发布:高效智能、安全无界的新一代平台的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 云栖掠影|回首开源十年,RocketMQ
- 下一篇: 云栖收官:想跟远道而来的朋友们说