专访阿里云萧少聪、曹龙:一家云厂商对入局数据库做了哪些思考?
曾經,一提起數據庫,似乎只有專業的數據庫廠商才足以研發。現在,這個邊界變得越來越模糊。在第九屆中國數據庫技術大會的現場,我們可以看到硬件廠商侃侃而談自己的數據庫產品,可以看到云計算廠商開始分享自己在數據庫領域的研發成果。
作為一家云計算廠商,數據庫顯然不是阿里云的主業,但在其官網的產品列表中,數據庫產品在數量上具有絕對優勢,為什么阿里云如此重視數據庫的發展?商用產品和開源產品一大堆,阿里云做數據庫的競爭力在哪?對于各大場合頻頻提起,多次被報道為數據庫領域新趨勢的HTAP,阿里云怎么看呢?
▲阿里云數據庫高級產品專家 蕭少聰
本文采訪嘉賓:蕭少聰(花名:鐵庵)阿里云數據庫高級產品專家。主要負責RDS產品的發展規劃及產品演進。2011年獲得Postgres Plus Professional認證,同年以理事身份籌建PostgreSQL中國用戶會,2015-2018年擔任PostgreSQL中國用戶會主席。
▲阿里云高級技術專家、架構師 曹龍
曹龍(花名:封神),阿里云高級技術專家、架構師,專注在大數據分布式計算、數據庫及存儲領域,先后研發上萬臺Hadoop、ODPS集群,先后負責阿里YARN、Spark及自主研發內存計算引擎,目前為廣大公有云用戶提供專業的云HBase數據庫及計算服務。
踏足數據庫領域,這家云計算廠商做了哪些思考?
數據庫是一款用戶粘性非常高的產品,一旦核心業務數據落定,企業輕易不會嘗試更換。在這個可以說對后來者不太友好的圈子,阿里云入局前是如何思考的呢?
用戶需求驅動和技術沉淀應該是大多數廠商踏足數據庫領域的原因,這也同樣是阿里云入局原因之一,只是在程度上有所不同。根據蕭少聰的介紹,作為一家云計算廠商,阿里云長期服務于眾多不同類型的用戶,對用戶痛點挖掘更深。在新的時代背景下,現有產品無法滿足用戶新的應用需求,同時不能充分發揮新硬件的性能;當然,這個問題不僅用戶存在,阿里巴巴自身同樣存在。阿里所面對的龐大數據量和復雜的業務場景是很多廠商無法觸及的,這讓阿里內部很早就著手于數據庫的研發,目前提供的不少數據庫產品正是阿里多年技術能力對外輸出的表現。
如果單憑這兩點,阿里云確實有一定優勢,但并不足以構成核心競爭力。對企業和廠商而言,現在做數據庫的門檻并不像從前那么高,數據庫領域的廠商也越來越多,核心競爭力只可能從差異性發展而來,人人都在做且會做的東西很難形成核心競爭力。
曹龍表示,阿里云做數據庫與第三方數據庫廠商最大的差異性在于云,阿里云強調云數據庫,這就意味著共享,通過程序共享,讓企業享受更低成本,當然,前提是你的用戶足夠多;其次,阿里云平臺的產品多樣性以及無縫對接能力同樣是很多廠商短時間內無法達到的,阿里云平臺所承載的產品不僅僅只有云數據庫,各產品之間已形成良好打通,一個平臺足以解決多類場景問題。
思考結束,阿里云正式踏入數據庫領域,準確的說應該是踏入云數據庫領域。
開源商用,阿里云如何和開源產品拉開距離?
阿里云不乏開源商用云數據庫產品,蕭少聰和曹龍本人負責的RDS系列及云HBase就是最好的示例。當然,不僅僅是阿里云,不少數據庫廠商都會在開源基礎上進行修改。既然是在開源基礎上進行修改,企業不免思考這個事我自己能不能做?我是否有必要購買這款商用產品?
企業要基于開源進行修改首要思考的就是技術和人才是否到位,人才問題暫且擱置一邊,如果你有足夠高的籌碼,人才問題比較好解決。我們先來討論技術問題,以阿里云RDS和云HBase為例,企業不妨看看阿里云都做了哪些改進?
首先是云數據庫RDS PPAS版,這是阿里云與EnterpriseDB公司合作基于PostgreSQL高度兼容Oracle語法的數據庫服務。眾所周知,EnterpriseDB本身就是一家提供基于PostgreSQL企業級產品與服務廠商,基于EnterpriseDB的部分技術能力,阿里云構建了自己的RDS PPAS版,蕭少聰坦言,PPAS與PostgreSQL的內核都是一樣的,PPAS只是多了Oracle兼容性,可唯這一點便解決了很多企業的大難題。
企業中不乏想從Oracle遷移到其它商用或開源解決方案的,雖然遷移工具很多,但很難保證百分百兼容且應用程序完整遷移上云。PPAS要解決的問題是不同架構和不同底層數據庫之間的遷移,將應用程序從Run Oracle完整遷移到Run PPAS。如果想更換其他開源解決方案,企業可以先從Oracle遷移到PPAS,整個過程語法改寫較少。熟悉了云數據庫架構之后,企業可以另行選擇其他解決方案,PPAS在這個過程中更多扮演著橋梁的角色。 綜上,這些都讓PPAS與開源PostgreSQL、其他商用解決方案拉開距離。加之阿里云提供全流程的ADAM(亞當)平臺,協助用戶進行遷移的:事前評估、過程管理、數據同步、保障性回流、上線前性能對側、應用程序兼容SQL發現等功能,使得用戶進行數據庫異構遷移過程更有保障。
如果談起曹龍負責的云數據庫HBase,這是一款基于Hadoop且百分百兼容HBase協議的分布式數據庫。近些年,HBase在許多大型甚至超大型公司被廣泛應用,阿里巴巴內部就有很多場景應用了HBase,因此,性能優化從未停止。但是,追求性能的同時必然會損失其他特性,比如易用性、備份恢復等。阿里云對于HBase的改進首先從內核及架構開始,對讀寫、延遲以及壓縮算法等各方面進行了深度優化;其次,完善中小企業關心的易用性、備份恢復以及SQL入口......
RDS產品系列不只有PPAS,阿里云云數據庫也不只有RDS和云HBase。蕭少聰認為,今天所提到的數據庫,不僅僅是一個引擎,更是一整套管理體系,一個完整的云解決方案,正是這樣的定位讓阿里云的云數據庫產品與開源產品真正拉開距離,就好比雖在同一起點卻是兩條跑道。
HTAP到底是不是數據庫領域新趨勢? 阿里云:是,但這不會是終局!
去年,我們就見過不少文章將HTAP列入未來數據庫領域發展趨勢之一,HTAP意味著可以通過一個數據庫系統同時滿足事務性需求和分析型需求,最具代表性的當屬谷歌的Spanner+F1論文,產生了一大批NewSQL系統。對比這兩年出現在數據庫技術大會上的議題,今年關于HTAP的議題明顯增多,這會是數據庫領域的一大趨勢嗎?
對此,曹龍表示HTAP很難稱作數據庫領域的趨勢,如果算,可能也只是對少數公司而言。他表示,真正的大公司離線與在線分得很清楚,幾乎不會做HTAP,因為數據量實在太大。其次,如果要做,數據往往要打通,這里所說的數據不僅僅是業務數據,而是整個集團的數據,這對于大公司而言很難實現,但如果某個業務團隊有需求,還是可以實現的。
蕭少聰補充道,如果一家公司需要迅速將數據變現,在人力與物力不足的情況下,可以考慮采用HTAP的方式。同時,隨著硬件成本的逐年降低,這種方式可以在公司短期的發展內滿足訴求,但隨著公司數據量的擴大,我們也依然很難通過一個數據庫就解決所有問題。當數據量到達HTAP無法支撐時,通過獨立并專業的OLTP、OLAP、BigData數據庫系統,加上順暢的數據通道,實現業務流通分層計算,依然是現今最為成熟的方案。
綜上,HTAP適用于部分體量的公司,可能是這類公司數量增多,也可能是業務部門對該技術的需求上升,導致了HTAP在數據庫領域的關注度升高。但當公司成長到一定規模,這種方式顯然不適用于業務發展,當前我們還沒有看到HTAP可以做到獨領風騷,但這一技術架構確實會是企業某一發展階段的最佳選擇。
結語
近年來,從大批硬件和云計算廠商涌入數據庫市場就可看出,數據庫市場存在大量發展機會并蘊藏巨大價值。本以為阿里云做數據庫不過是想分一杯羹,但細算下來,筆者發現這家云計算廠商對用戶需求、企業痛點以及發展方向都做了不少思考,很擅長發揮自己的優勢。當然,阿里云確實有先天優勢,比如多年技術實力沉淀以及云計算業務積累的忠實用戶。但是,數據庫領域拼了這么久,誰又說得清勝負呢?路程還遠,尚未到蓋棺定論之時,但阿里云接下來在云數據庫領域的一切行動還是值得期待的。
總結
以上是生活随笔為你收集整理的专访阿里云萧少聪、曹龙:一家云厂商对入局数据库做了哪些思考?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 太白教你学python---博客分类目录
- 下一篇: ES-PHP向ES批量添加文档报No a