突破边界局限,阿里云神龙负责人张献涛分享15年虚拟化之路
2020年1月8日,彈性計算服務技術總負責人張獻濤受邀出席“面對面 見未來”的沙龍分享活動,現場聽眾主要是銀行、保險、證券等金融行業的CTO、CIO等。
演講開始前,聽眾們了解神龍云服務器的并不多。在聽完張獻濤的介紹后,他們對神龍興趣大增,在分享結束后紛紛與張獻濤交流討論,意猶未盡。
15年虛擬化技術之路
虛擬化是如今云計算行業的基礎,然而虛擬化最早并不是針對云設計的。
張獻濤回憶,他自2004年博士畢業后加入Intel虛擬化團隊,彼時國內虛擬化從業者少之又少,Intel也是在不久前決定在芯片中加入虛擬化的特性。
自此,張獻濤就踏上了虛擬化這條“人跡罕至”的技術之路。期間,隨著亞馬遜、阿里巴巴、盛大等公司開始涉足云計算,虛擬化也越發受到大公司關注。
在Intel深耕該領域多年的張獻濤,發現在技術層面的探索已面臨天花板。2014年,他帶著離客戶更近的想法,來到了阿里云。
“神龍”是如何誕生的
他回憶,最早的時候阿里云主要服務中小站長,他們對云的服務能力要求不高。“有時候我們發現網站掛了之后,客戶過了半天都沒發現”。
雖然當時針對中小型客戶服務能力“夠用”,在2014年,阿里云在開始構建服務中大型客戶的能力。2015年前后,張獻濤帶領技術團隊對阿里云彈性計算服務的系統架構做了重新設計和全面升級,云服務器實例性能提升了數倍。
高速發展的阿里云,同時也面臨著質疑:“你們的雙11上云了嗎?”
2014年,阿里巴巴啟動了全面上云計劃。“我們相信,如果雙11這種天量級場景都能跑,其他都不是問題。”張獻濤表示。
2016年,雙11絕大部分的流量完美運行在阿里公共云上,并且所有業務的性能損失都低于3%。然而,時任阿里巴巴CTO的張建鋒,提出了更高的要求:把虛擬化資源和性能損耗降到零!
這在當時是完全不可想象的任務。阿里云技術團隊把自己逼到了極限,不斷思考如何從這3%里再摳一點出來。
“幸運的是2016年發生兩件事:互聯網公司開始收購硬件公司;云原生來了,容器浪潮席卷全球。”
這兩種趨勢的啟發下,張獻濤決定用軟硬一體的方式,借助芯片的offloading技術,把虛擬機損耗降到零。
“神龍”突破物理機極限,性能大幅提升
“原來我們都認為,虛擬化技術的極限,就是物理機性能。”讓人驚喜的是,張獻濤在定下實現路徑后,經過分析認為,軟硬一體協同設計的架構,有可能可以突破了他本來的想象邊界,比物理機的性能還要好。
基于論證,張獻濤團隊對自己提出了更為大膽的目標:突破物理機性能極限。
團隊最后如愿以償。2019年,阿里巴巴雙11核心系統全面上云。數據顯示,容器在神龍云服務器上跑,性能比在物理機上提升20-30%。
發明創新,終究要回歸客戶價值
神龍表現喜人,張獻濤感悟,做技術還是要回歸客戶價值。“單純的喊話是不行的,我們需要解決他們的實際問題。”
阿里云的客戶要上云,是因為云解決了他的問題,不是為了上云而上云。
而今,隨著阿里云的發展,客戶的要求與5年前不可同日而語,也對阿里云的服務能力作出了更嚴格的要求。
“之前客戶的問題,我們比客戶發現得還早。現在大客戶的維護系統,看得比我們還細,有任何一個抖動,可能工單就過來了,解決不好就成為故障了。服務能力一定要提高,大客戶對服務能力要求很高。”
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的突破边界局限,阿里云神龙负责人张献涛分享15年虚拟化之路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 争议“云游戏”:一个几十亿规模的颠覆者?
- 下一篇: Flink 流批一体的实践与探索