十六款值得关注的NoSQL与NewSQL数据库--转载
原文地址:http://tech.it168.com/a2014/0929/1670/000001670840_all.shtml
【IT168 評論】傳統關系型數據庫在誕生之時并未考慮到如今如火如荼的移動、社交以及大數據負載類型,同時也并不適合處理極端規模處理任務。不過大家不必擔心,十六家專業企業已經為我們帶來他們各自的次世代NoSQL與NewSQL選項。
為什么在處理全新數據類型以及極端業務規模實例時,企業正越來越多地選擇備用方案來替代占據領導地位的關系型數據庫管理系統(簡稱RDMS)?
帶著這個問題,我們與The Weather公司CIO Bryson Koehler進行了交流——這家公司目前正利用以Riak這款NoSQL數據庫為基礎的云天氣預報系統,以系統每天20TB的驚人速度處理數據。他的回答非常堅決:
“我們知道自己需要在全球范圍內運行,我們也知道自己需要處理天文數字級別的龐大數據總量。我知道自己需要從本質角度考慮如何建立這套系統方案。我不希望以附加方式實現、不希望它變成選項而非惟一答案,我更不希望被迫為其設立一個技術團隊來專司維護工作。傳統關系型數據處理方案繁瑣而復雜,在我看來它也無法應對全球化規模的處理任務。”
在大規模云部署體系中,NoSQL的加入能夠給我們帶來強有力的支持。我們同樣也聽到過很多關于NoSQL靈活性、與架構無關的數據處理特性以及MongoDB與Couchbase等產品在部署簡便性方面的優勢。支持者們認為這些解決方案能夠獲取移動、社交、點擊流以及傳感器數據,而且在他們看來、為傳統數據庫添加JSON支持無異于為小豬描上口紅。
面對這樣的實際需求,很多支持者可能會力挺NoSQL產品——我們姑且不說SQL——已經是一種成熟的語言,支持著各種類型的事務型與分析型實例。而在NewSQL方面,目前已經有Clustrix、MemSQL以及VoltDB等廠商提供此類解決方案,承諾在保證NoSQL全球化擴展能力的同時又無需放棄SQL特性。
到目前為止,NewSQL選項在人氣方面還遠不及NoSQL類方案,這一部分是由于其面世時間相對較短、另一方面也是因為將傳統方案與數據靈活性相結合絕非易事。進一步講,NewSQL供應商們還需面對來自老牌SQL廠商的競爭壓力,而客戶們也更傾向于利用自己熟悉的老辦法來解決業務中的新問題。不過NewSQL廠商們認為,這樣的作法是個“代價高昂的錯誤”。
今天我們將一同近距離審視十六款值得關注的NoSQL與NewSQL數據庫管理系統。今天我們暫時將圖形數據庫排除在外,這類方案主要用于非常特殊的網絡分析環境,而且也不像NoSQL或者NewSQL那樣屬于適合廣泛使用的方案。同樣被排除在外的還有Redis以及Memcached等高人氣產品,二者更接近數據緩存層而非持久性數據存儲方案。
今天整理出的集合與之前的那篇《十六款頂級大數據分析平臺》也有所區別——雖然這些產品也能夠滿足操作型分析處理需求,但運行事務型應用才是其核心重點,而這也是數據庫與分析平臺之間的主要差異。我們也沒有在標題中采用“頂級”之類的字眼,因為這場比拼尚未塵埃落定,特別是NewSQL陣營的競爭更加有待觀察。
閑言少敘,下面我們就一同看看這些面向現代數據管理需求的新型選項。
Aerospike內存支持實時決策
DBMS類型:?NoSQL
描述:?閃存優化、分布式內存內數據庫提供ACID合規性與可調整一致性
知名客戶:?Appnexus, BlueKai (現在由甲骨文持有), eBay
公司情況:?私營企業,于2009年建立,原名為Citrusleaf公司。
評論:?Aerospike提供的內存內速度優勢吸引到了眾多要求實現毫秒級響應時間的廣告網絡以及其它Web規模企業的高度關注。Aerospike目前正積極進軍新的業務類別,包括游戲、電子商務以及安全等對延遲狀況要求較高的一切環境。我們也將密切關注這套平臺,看看Aerospike是否能成為應用范圍更廣泛的解決方案。
官方網站:http://www.aerospike.com/
Cassandra在全球可擴展性競爭中一路領跑
DBMS類型:?NoSQL
描述:?大規模可擴展分區行存儲,配備多數據中心復制功能
知名客戶:?Constant Contact, eBay, Netflix
公司情況:?Cassandra是由私營公司DataStax支持的開源項目,該公司成立于2010年
評論:?Apache Cassandra的主要優勢包括靈活性、NoSQL數據模型、多數據中心支持以及在集群化商用硬件上的線性可擴展特性。商業支持與軟件發行版目前已經由DataStax正式提供。Cassandra一直享有最具可擴展性NoSQL數據庫的良好聲譽,不過它的高度復雜性也一直飽受詬病。財力雄厚的DataStax公司目前正在努力簡化產品在企業用戶層面的可管理性,同時為其加入了低延遲內存內功能;就在最近,Cassandra還根據需求與Apache Spark進行了集成。Couchbase與HBase都是Cassandra的主要競爭對手,其中后者運行在Hadoop環境下、也被廣泛視為最關鍵的一大潛在威脅。
官方網站:http://www.datastax.com/
?
Clustrix承諾為SQL帶來Web規模
DBMS類型:?NewSQL
描述:?分布式關系型DBMS支持自動分區與復制功能
知名客戶:?AOL, Rakuten,賽門鐵克
公司情況:?私營企業,創立于2006年
評論:?Clustrix一直以高度分布式特性、可擴展容錯性且無需犧牲SQL或者ACID事務處理性能為主要賣點。該公司為客戶Twoo.com網站建立過21節點部署方案(如上圖所示),這也成為“全世界規模最大的向外擴展SQL部門項目。”各大NewSQL供應商都承諾在大規模部署環境下降低運營合規性難度(與現有數據庫相比)。Clustrix面臨的挑戰與競爭對手包括MemSQL、NuoDB以及VoltDB,它們既擁有自己的差異性優勢、同時也依靠能夠快速構建的優勢成功吸引到了眾多大規模客戶。
官方網站:http://www.clustrix.com/
Couchbase緊緊跟隨移動應用的腳步
DBMS類型:?NoSQL
描述:?面向文檔的數據庫,配備移動同步與可嵌入數據庫選項
知名客戶:?Concur, LinkedIN, Zynga
公司情況:?私營企業,創立于2009年
評論:?Couchbase一直致力于涵蓋所有業務類型,承諾提供MongoDB當中的文檔處理優勢以及Cassandra的可擴展性優勢。該公司最新推出的方案為Couchbase Mobile,這個于今年五月面世的項目能夠保證移動應用在聯網或者不聯網的情況下始終正常運行。該系統將Couchbase Lite可嵌入設備數據庫與接入中央Couchbase Server的Couchbase Sync Gateway相結合。我們將繼續關注Couchbase能否在各條戰線上獲得成功。
官方網站:http://www.couchbase.com/
DynamoDB為大規模云應用提供支持
DBMS類型:?NoSQL數據庫服務
描述:?運行在多個Amazon Availability Zone之上且配備S3備份機制的調整可擴展鍵-值服務
知名客戶:?AdRoll, Elsevier, SmugMug
公司情況:?自1997年起正式上市
評論:?Amazon公司開發出Dynamo是為了擴大其發展勢頭迅猛的電子商務業務的規模,而且其2007年企業白皮書的發布還為Cassandra、Riak以及其它NoSQL等發展中項目提供了靈感。DynamoDB數據庫服務于2012年正式推出,當初它的出現可謂一枝獨秀,不過目前數據庫服務陣營已經逐漸擴張。目前大家可以選擇在同一套云環境中使用多種流行開源數據庫(例如Couchbase、MongoDB以及Riak等等),并在必要時將其遷移至其它云或者是內部環境當中。目前還沒有哪種內部或者云備選方案能夠取代DynamoDB。如果大家在企業中已經全面采用AWS,那么DynamoDB無疑是一套快速、靈活且具備高可擴展性的解決選項。
官方網站:http://aws.amazon.com/dynamodb/
HBase在Hadoop上實現NoSQL
DBMS類型:?NoSQL
描述:?寬列式數據庫,建立在Hadoop分布式文件系統(簡稱HDFS)基礎之上
知名客戶:?Bloomberg LP, Facebook, Nielsen
公司情況:?無,HBase是開源Apache Hadoop中的一項功能方案
評論:?HBase是一套運行在HDFS之上的NoSQL數據庫,因此它能為用戶帶來獨特的功能——直接處理存儲在Hadoop當中的數據。其特性包括巨大的可擴展性(被用于Facebook的消息傳輸系統當中)、讀取與寫入一致性、表分區自動化處理與可配置能力以及自動故障轉移功能。直到現在也就是2014年年中,HBase仍然處于0.98.3版本,這也成為導致其始終無法得到廣泛應用的“主要”原因。毫無疑問,HBase擁有巨大的發展潛力,但相對于Hadoop框架迅猛的發展速度,它的開發進程一直顯得有些滯后。我們將持續關注一系列相關項目,包括用于實現YARN支持的Hoya、用于SQL支持的Phoenix、用于應用程序開發的Kiji以及承諾打造更成熟、更實用HBase方案的Facebook Hydrabase項目。
官方網站:?http://hbase.apache.org/
IBM匆匆拿下Cloudant,但接下來要做什么?
DBMS類型:?基于云的NoSQL DBMS服務
描述:?基于CouchDB的文檔存儲數據庫即服務
知名客戶:?Expedia, DHL,三星
公司情況:?Cloudant于今年二月被IBM所收購。
評論:?當IBM收購Coudant時(具體收購條款并未公開),專家們認為這筆交易的核心在于獲取后者的數據庫即服務技術及專業知識。一位IBM公司高管也談到了底層開源CouchDB DBMS的重要性(請不要把CouchDB DBMS與CouchDB相混淆)。DBMS的特性包括可擴展性、可用性、耐久性、讀取與寫入一致性再加上靈活的數據處理能力(其中包括JSON、全文本以及地理空間數據)。不過CouchDB最近幾年似乎被其它NoSQL競爭對手奪去了風頭。令人困惑的是,IBM甚至與NoSQL市場上的領導者MongoDB建立起重要的合作關系。不用說,我們將看到IBM在這方面作出下一步行動。我敢打賭,我們會看到更多利用Cloudant功能的數據庫即服務方案。
官方網站:https://cloudant.com/
?
MarkLogic帶來成熟的靈活數據管理方案
DBMS類型:?NoSQL
描述:?面向文檔的數據庫,支持符合ACID原則的事務處理與內置搜索功能
知名客戶:?DowJones, Citigroup, Boeing
公司情況:?私營企業,創立于2001年
評論:?MarkLogic早在NoSQL概念廣泛普及之前就已經作為成功的XML數據庫而擁有悠久的發展歷史。MarkLogic被廣泛用于各類大規模技術、金融、法律、醫療以及科學等要求靈活管理并重新使用信息的重量級領域。目前這款與架構無關且具備高度可擴展性的集群化DBMS作為NoSQL文檔存儲方案而獲得了廣泛應用。該公司多年來始終致力于構建企業級功能,其中包括復制、回滾、自動化故障轉移、時間點恢復以及備份/恢復。MarkLogic已經擁有多家高端(大部分集中在出版行業)客戶。這家公司能否在MongoDB的環伺之下進一步擴大其普及范圍?請大家拭目以待。
官方網站:http://www.marklogic.com/
MemSQL將內存內性能與SQL相結合
DBMS類型:?NewSQL
描述:?大規模內存內行存儲方案,最近還加入了列式式分析功能。
知名客戶:?Comcast, CPXi, Shutterstock
公司情況:?私營企業,創立于2011年
評論:?顧名思義,MemSQL與其它大規模NoSQL方案的主要區別在于它結合了內存內機制、符合ACID原則的事務處理性能以及SQL兼容性。除了將關系型接口添加到內存內數據層,MemSQL最近還在閃存與磁盤存儲選項中支持壓縮列式存儲機制,從而深度實現歷史分析功能。MemSQL的主要競爭對手為老牌方案VoltDB(以及其它NewSQL數據庫),因此這場進行中的競逐將在比拼的同時拓展NewSQL地位以及客戶的接納程度。
官方網站:http://www.memsql.com/
MongoDB呼吁現代開發者的加入
DBMS類型:?NoSQL
描述:?文檔存儲DBMS
知名客戶:?思科, eBay, Intuit, MetLife
公司情況:?私營企業,于2007年創立,最初名為10Gen
評論:?開源MongoDB是目前人氣最高的NoSQL數據庫,目前其下載量已經超過700萬次,實際部署案例也高達數十萬。之所以能夠獲得熱烈歡迎,MongoDB最大的賣點在于簡單易行的開發流程以及對來自移動、社交以及Web應用程序的現代數據的靈活處理能力。今年五月MongoDB迎來了2.6版本,該公司借此進一步簡化了管理工作、強化了安全性并改進了分析功能。這個版本還提升了可擴展性,從而與Cassandra、Couchbase以及Riak等競爭對手縮小這方面的差距。不過相對于可擴展性,MongoDB能夠為各類全球化、PB級別且由成百上千用例構成的整體部署方案帶來出色的處理速度、開發簡易性以及靈活的數據管理機制,這一切足以使其贏得新客戶們的青睞。
官方網站:http://www.mongodb.com/
NuoDB將SQL與云集于一身
DBMS類型:?NewSQL
描述:?向外擴展關系型DBMS支持持續可用性、地理分布以及云部署方案
知名客戶:?AutoZone, Dropship Commerce, NorthPoint Solutions
公司情況:?私營企業,創立于2010年
評論:?NuoDB是另一家NewSQL新興企業,而且也承諾為客戶帶來可擴展性、地理分布部署以及各類為人們所熟知的SQL特性。不出所料,它具備良好的高可用性、熱升級、數據冗余以及災難恢復能力。NuoDB的一大發展轉折在于通過內置的多租戶支持能力著重強調云部署方案。它是一款很有前途的產品,但作為一家年輕的NewSQL供應商,NuoDB仍然需要進一步向客戶證明自身的卓越之處。
官方網站:http://www.nuodb.com/
甲骨文NoSQL數據庫:老廠商、新方案
DBMS類型:?NoSQL
描述:?分布式鍵-值存儲數據庫,源于BerkeleyDB
知名客戶:?Catalyst IT Services, Passoker, Payback
公司情況:?于1986年上市
評論:?NoSQL市場上的各位領導者紛紛表示他們從未將甲骨文NoSQL數據庫視為具備競爭力的解決方案,但相信這種情況將很快改變。該產品的目標客戶群體顯然由那些忠誠的甲骨文方案買家構成,這也符合大多數主導型廠商的供求關系。大家可以免費下載到這款可擴展、分布式鍵-值存儲方案的社區版本,也可以為社區版與完成度更高的企業版購買技術支持服務。該數據庫也被綁定在甲骨文大Big Data Appliance中并與其基于Cloudera的Hadoop發行版相集成。甲骨文NoSQL技術社區實際上并不會發布公告或者組織活動,但甲骨文龐大的客戶群體當中仍有可觀的一批支持者將其視為靈活且可擴展的NoSQL備選方案。
官方網站:http://www.oracle.com/us/products/database/nosql/overview/index.html
?
Riak走向大規模環境、走向云端
DBMS類型:?NoSQL
描述:?分布式鍵-值存儲方案,具備多數據中心復制與自動平衡功能
知名客戶:?Best Buy, Ideeli, The Weather Company
公司情況:?由私營企業Basho公司支持的開源項目,該公司創立于2007年
評論:?開源Riak在設計目的上主要考慮到高度可擴展性、可用性、容錯性以及操作便捷性。由Basho支持的Riak企業版及Raik CS版還加入了對企業級功能的支持以及與Amazon Web Services S3云存儲相兼容的能力。The Weather Channel將Riak引入Amazon云,并以其簡便性、可擴展性以及始終可用性作為主要賣點。Riak的環狀節點集群方案(如上圖所示)允許用戶隨意添加或者移除虛擬節點并據此對數據進行重新分配。Basho公司宣稱自己的方案兼有Cassandra的規模優勢與更出色的操作便利性。Basho在過去一年中取得了可觀的運營收益,不過我們預計其營收未來將趨于穩定、而Basho也將繼續推動云部署并以易于操作作為自身特色。
官方網站:http://basho.com/
Splice Machine將事務型SQL推向Hadoop
DBMS類型:?NewSQL
描述:?SQL-on-Hadoop RDBMS,支持事務與分析型處理任務
知名客戶:?Harte Hanks
公司情況:?私營企業,創立于2012年
評論:?目前市面上的SQL-on-Hadoop方案可謂層出不窮,但新興企業Splice Machine顯然擁有自己的獨門秘笈——該方案能夠在Hadoop之上運行事務型應用程序并且同時支持分析型應用。其客戶Harte Hanks公司表示,他們目前運行著大量專門針對傳統數據庫所設計的應用程序,其中包括IBM Unica、COgnos BI以及Ab Initio數據集成軟件。這是一家非常年輕的企業,知名客戶的名單也顯得有些寒酸。不過在Hadoop之上運行事務型應用實在是種獨特的思路,這也足以使該公司在英才濟濟的NewSQL市場上贏得關注。
官方網站:http://www.splicemachine.com/
Translattice將PostgreSQL發揚光大
DBMS類型:?NewSQL
描述:?分布式關系型DBMS,具備云與設備部署選項
知名客戶:?Oakland Raiders
公司情況:?私營企業,創立于2007年
評論:?TransLattice以一套大規模分布式PostgreSQL衍生版本起家,項目最初被定名為TransLattice彈性數據庫,可以被部署在內部、設備上或者多云環境之下。2013年該公司收購了StormDB,這也是一家致力于擴展PostgreSQL廠商,并利用其知識產權打造出了Postgres-XL——一款可擴展、大規模并行分析數據庫。之所以進行此次收購,TransLattice是希望能讓多數Postgres用戶以熟悉的方式實現對大數據OLTP以及分析的擴展任務。單薄的公共客戶參考名單顯示,TransLattice與不少NewSQL供應商一樣仍然需要進一步證明自己的市場吸引力。
官方網站:http://www.translattice.com/index.shtml
VoltDB打理高速流數據
DBMS類型:?NewSQL
描述:?符合ACID與SQL原則的內存內關系型數據庫
知名客戶:?BooYah, Novatel Networks, QualityHealth
公司情況:?私營企業,創立于2009年
評論:?VoltDB擁有大規模高速事務處理能力,這要歸功于其采用的高分布式內存內架構。作為一套開源GNU許可DBMS并由聯合創始人/DBMS大牛Michael Stonebraker博士參與的解決方案,VoltDB能夠處理來自電信、移動廣告網絡以及游戲公司的快速流數據。于今年年初發布的VoltDB 4.0還對分析處理能力進行了升級,帶來了更高的查詢數據執行能力、支持并發用戶操作以及更深層次的SQL時間序列分析能力。VoltDB的直接對手包括MemSQL、NuoDB以及Clustrix,不過今年甲骨文與微軟也相繼加入戰團、希望利用其現有數據庫管理系統更為客戶所熟悉的優勢在市場上保持競爭力。
官方網站:http://voltdb.com/
英文原文鏈接:16 NoSQL, NewSQL Databases To Watch
總結
以上是生活随笔為你收集整理的十六款值得关注的NoSQL与NewSQL数据库--转载的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nyoj 284 坦克大战 (优先队列)
- 下一篇: Swift 绘图板功能完善以及终极优化