巨杉数据库:金融级数据库是怎样炼成的
巨杉數據庫:金融級數據庫是怎樣煉成的
?
巨杉數據庫SequoiaDB是一家特立獨行的金融級數據庫廠商。大型企業客戶需要“原廠”金融級數據庫產品和服務,巨杉數據庫堅持以此為宗旨,歷經6年從1.0到3.0的不斷迭代創新,目前已經廣泛應用于銀行、證券、保險、政府、電信等大型企業的核心生產系統。
?
巨杉聯合創始人王濤表示,在業務量爆炸性增長的今天,傳統數據庫正面臨著巨大的挑戰,例如Oracle、DB2,其擴展能力和性價比都存在相當的局限性。大型企業需要的是既有分布式能力,又如Oracle這樣能達到金融級水準的數據庫產品。
?
因此,在6年不斷成長創新迭代中,巨杉改變了國產數據庫長期低迷的狀態。在分布式領域,巨杉數據庫已經走在Oracle 12c的前面。
?
?
“金融級”的核心來自于原廠的產品能力
?
大型企業IT的管理是個非常復雜的過程,既要考慮技術的先進性,也要滿足各種系統的兼容、合規以及風控的要求。因此,大型企業在選擇技術產品時,首先要判斷該產品是否滿足企業級需求。
?
除了高性能與可靠性以外,企業級最根本的核心是產品化,適用于多種負載及業務場景;以及原廠支持能力,并且提供源代碼及內核開發人員級別的技術支撐。
?
互聯網公司的技術發展路線是以解決自身業務的特定場景和功能為目的,并不考慮產品化,這和面向大型企業的產品發展路線相比,是兩種不同的模式。這也是為什么互聯網巨頭也很難推出金融級產品的原因。
?
所以說,滿足金融級需求的核心要素是原廠產品能力,即完全自主掌控產品代碼和產品的發展路線。
?
銀行是金融級應用的標桿
?
以銀行為首的金融行業占據了50%以上的企業級IT投入,接著才是政府、運營商等行業。一般來說,一家銀行通常擁有超過百種以上的業務系統,而且歷經幾十年的法律和業務規則的演進。因此,業界公認銀行在選擇技術產品過程中,對于安全性、可靠性、復雜度等企業級功能要求最為嚴苛。
?
銀行作為企業級軟件應用的標桿行業,被其采用的產品達到了金融級產品的最高標準,自然更能夠滿足其他行業的要求。
?
?
?1、銀行用戶對于產品的選擇非常嚴苛,為什么這么多銀行會選擇巨杉數據庫呢?
?
這得益于巨杉的企業級基礎軟件基因。巨杉的研發技術以IBM?DB2數據庫和華為分布式技術團隊為班底,是中國最好的“原廠”數據庫產品團隊。
?
巨杉數據庫經過6年從1.0到3.0的不斷迭代創新,歷經了大中型銀行核心生產系統的嚴格驗證和洗禮,厚積薄發,才成為被銀行金融業界所信任的金融級數據庫產品。
?
?
2、數據庫產品的發展曲線和生命周期都比較長,這是什么原因呢?巨杉對于此的觀點怎么樣的呢?
?
的確如此,數據庫是基礎性軟件,好比汽車的引擎一樣,是任何系統的_關鍵部件,具有“牽一發而動全身“的特性。這就要求數據庫具有相當高的成熟度。這種成熟度需要在技術、產品、工程、支持以及行業經驗上具有相當長時間的積累。
?
傳統的關系型數據庫中,例如Oracle、IBM DB2等,都歷經20多年才達到現在的版本。任何一款數據庫從研發到產品都是一個歷經磨難的過程,一般需要6年以上的時間才能走出0到1 的階段,然后再在行業和實際應用場景中不斷地歷煉打磨,逐步過渡到成熟期。
?
另外,金融級數據庫產品面對的是諸如銀行、證券、保險等頭部行業大型企業,對產品上的復雜度和成熟度又提出了更高層次的要求。因此,其生命周期還要更長。
?
SequoiaDB作為金融級數據庫產品歷經6年發展,進入3.0時代,得到上百家大型銀行等大型客戶的采用和信任。這標志著巨杉數據庫已經進入了數據庫生命曲線的成熟期。
?
3、巨杉一直堅持“原廠”,這是為什么?
?
這和巨杉的商業模式息息相關。巨杉主營是數據庫產品及服務,服務于很上百家大型的企業,上千的業務系統,每年還在不斷地增長。數據庫作為基礎工具型軟件,要滿足各種系統需求,而不為單一特定的場景服務。做到這點的核心就是“原廠”掌握核心代碼,掌控產品路線,能夠快速應對客戶需求的同時也能保證產品化。
?
我們都知道,細節定成敗,實踐出真知,技術實力的背后是產品能力。一個成熟的產品需要不斷的在大規模的金融級應用中實踐與礪煉。這個過程就是不斷爬坑、不斷積累經驗和不斷完善細節。
?
這對一個產品研發的工程及管理能力提出了相當高的要求。例如巨杉數據庫產品的測試,產品達到99%以上自動化測試覆蓋率,為保障質量,每個小版本的測試都涉及12,000個以上的測試用例,橫跨超1000個服務器節點。
?
只有這樣,我們的產品才能做到只用一個產品、一個研發團隊來滿足所有的客戶,提供“原廠”代碼級別的支撐服務。
?
4、巨杉數據庫和Oracle,?MySQL這樣的傳統關系型數據庫的關系和對比是怎么樣的?有何優勢?”
?
巨杉的發展目標就是想成為“分布式”的“Oracle”。怎么解釋呢,就是說從金融級產品能力和服務能力要達到Oracle的水準,但又是分布式的新一代數據庫。巨杉在分布式領域已經處于領跑地位,跑在了Oracle 的前面。
?
例如,巨杉數據庫在同一個分布式架構下支持非結構化的對象存儲,能夠在高并發場景下處理多種結構數據,大規模地降低了運維成本。這相比傳統數據庫是個獨特的優勢。
?
對比MySQL則大不相同,巨杉數據庫專注服務于大型的企業,MySQL則是更偏向于互聯網、創業階段的中小企業市場,金融級產品標準和服務對象都不一樣。
?
5、分布式數據庫真的是未來的方向嗎?
?
這點毋庸置疑。分布式的研究來自于并行計算,這其實很早就有,不是個新鮮事物。只不過過去網絡、存儲、計算成本比較高的時候,分布式的成本和性價高。造成做分布式數據庫從成本和應用角度上不合適。
?
現在網絡、存儲、計算成本都大幅降低,這就是摩爾定律的威力。也是造成互網聯網在過去20年內的高速發展。發展到了現在,這種利用x86服務器做分布式計算的能力已經大幅度超越了傳統集中式的能力。加之現在數據使用的量級也是每年技術級的增長,傳統數據庫力不從心,因此從需求和技術能力兩個方面都使得分布式數據庫成為必然。
?
6、現在大型企業就需要“兩地三中心”的說法,分布式數據庫能解決這個問題嗎?
?
兩地三中心是指跨地域的數據中心,是分布式的最重要的應用場景。Oracle在1992年開始就研究跨地域的數據同步,結果因為關系型的特點,優勢也成了劣勢,在分布式發展上非常失敗,所以回歸到集中模式了。
?
這里面在術語上有“一致性”的問題,就是如何保證不同地域節點的數據相同。其中強一致指任何時候不同節點的數據都相同,而最終一致性指經過很短的時間延遲后,不同節點的數據最后終會相同。這在過去傳統數據庫里不可調和。分布式解決這個問題的能力非常強大,可配置的一致性是分布式數據庫的重要部分,可以解決不同業務場景對不同一致性的需求。
?
所以巨杉數據庫的特點之一就是支持兩地三中心的架構。
?
7、國外很多分布式的數據庫也開始提供SQL支持了,巨杉也支持是吧,這是為什么?
?
巨杉支持SQL要回到2014年了,比國外同行起步早很多。巨杉當時雖然在性能上獨樹一幟,但是很快發現客戶的開發和運維都太習慣SQL了。SQL是個非常好的語言和工具,歷經40年培養了大量的用戶人才和應用習慣。可以說,99%的企業用戶都需要SQL。
?
巨杉的技術驅動來自于用戶和市場,所以當機立斷,我們就開始增強對SQL的支持,到現在,我們同時支持高并發的標準SQL也支持分析型的Spark SQL,滿足不同的用戶需求。
?
8、巨杉是NoSQL數據庫還是NewSQL,很多人都混淆,能解釋一下嗎?
?
巨杉數據庫在經歷了多年的發展以來,經歷了從NoSQL向NewSQL再向關系型數據庫不斷演進的過程,如今已經支持標準SQL、OLTP、對象存儲以及JSON存儲等多種模式。
?
根據Gartner的定義,如今的巨杉數據庫是一個典型的多模數據庫(Multi-Model Database),可以被當做關系型OLTP數據庫使用的同時,也支持半結構化數據與非結構化數據的存儲。
?
9、在產品上,目前巨杉數據庫的對標目標已經是Oracle而超越了MongoDB,在企業級市場特別是銀行,為什么能夠比MongoDB更為成功?
?
巨杉數據庫 3.0是一款分布式對象存儲、分布式文檔型和分布式OLTP全覆蓋的多模(Multi-Model)金融級分布式數據庫,而MongoDB,couchbase等產品僅相當于巨杉數據庫的一個子集。
?
SequoiaDB從開始之初就定位于原廠的金融級產品,1.0版本起就直接被銀行企業采用。MongoDB是面向開發者、程序員的數據庫產品,幫助開發快速迭代。所以SequoiaDB和MongoDB的出發點截然不同。
?
SequoiaDB從2.0版本開始,向著分布式多模數據庫不斷演進,大力發展SQL支持能力。不管從功能上還是性能上都超越MongoDB。
?
巨杉數據庫的商業模式對標Oracle,以大型企業為服務對象,而MongoDB則服務于長尾的中小型企業市場,雙方的用戶領域大不相同。因此巨杉并沒有把MongoDB作為對標產品和競爭對手。
?
10、2012年成立至今,巨杉數據庫經歷哪幾個發展階段?整個產品打磨經歷了多長時間?
?
2012年,巨杉數據庫在公司成立之初,利用分布式的特征提高性能,解決傳統關系型的性能瓶頸。最早的版本是分布式文檔型數據庫,分布式架構下主要以高并發性能為優勢特點。
?
2015年初 2.0版本開始向多模(Multi-Model)的分布式數據庫發展,包括OLTP和SQL的支持,增加高并發查詢的SQL引擎和分析為主的Spark SQL引擎,并成為了Spark的全球14個發行商之一。
?
同時,巨杉也開發分布式對象存儲引擎,在同一個分布式架構下能同時管理操作記錄型數據和非結構化的塊結構數據。
?
2017年巨杉數據庫全面支持高性能海量數據處理,事務處理,數據庫級別的HTAP以及對象存儲等多種應用場景,并繼續加強分布式OLTP的能力。
?
?
總結
以上是生活随笔為你收集整理的巨杉数据库:金融级数据库是怎样炼成的的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用Kubernetes部署超级账本Fab
- 下一篇: 埃森哲咨询公司为何拥有世界上最多的区块链