Greenplum数据库(GPDB)初识
1、特性
Greenplum數(shù)據(jù)庫(GPDB),分布式數(shù)據(jù)庫,數(shù)據(jù)倉庫快速查詢工具,特性:
1)GPDB完全支持ANSI SQL 2008標(biāo)準(zhǔn)和SQL OLAP 2003 擴(kuò)展,從應(yīng)用編程接口上講,它支持ODBC和JDBC;和 NoSQL、NewSQL和Hadoop 等不支持 SQL不一樣 ;
2)支持分布式事務(wù),支持ACID;保證數(shù)據(jù)的強一致性。
3)分布式數(shù)據(jù)庫,擁有良好的線性擴(kuò)展能力。
我的一個簡單理解就是:Hadoop和GPDB都是分布式集群(分布式存儲和分布式計算),不同的是GPDB是支持SQL標(biāo)準(zhǔn),或者說處理和存儲結(jié)構(gòu)化數(shù)據(jù),適用OLAP和OLTP,適用數(shù)據(jù)集市和數(shù)據(jù)倉庫的建設(shè)。
2、架構(gòu)
數(shù)據(jù)庫由Master Severs和Segment Severs通過Interconnect互聯(lián)組成。
1)Master主機負(fù)責(zé):建立與客戶端的連接和管理;SQL的解析并形成執(zhí)行計劃;執(zhí)行計劃向Segment的分發(fā)收集Segment的執(zhí)行結(jié)果;Master不存儲業(yè)務(wù)數(shù)據(jù),只存儲數(shù)據(jù)字典。 ?
2)Segment主機負(fù)責(zé):業(yè)務(wù)數(shù)據(jù)的存儲和存取;用戶查詢SQL的執(zhí)行。?
Master類似于Hadoop平臺的Namenode,而Segment則類似于Hadoop平臺的Datanode。
?greenplum使用mpp架構(gòu)。
?greenplum部署體系
3、Master節(jié)點:
master node高可用,類似于hadoop的namenode和second namenode,實現(xiàn)主備的高可用。
4、Segments節(jié)點
5、管理
1)數(shù)據(jù)裝載和性能監(jiān)控
2)并行備份和恢復(fù)
3)數(shù)據(jù)訪問流程
4)查詢流程:分查詢創(chuàng)建和查詢分發(fā),計算后將結(jié)果返回
5)分布存儲
數(shù)據(jù)的分布,分為hash分布和隨機分布兩種。
在線數(shù)據(jù)分布:均勻分布
總結(jié)
以上是生活随笔為你收集整理的Greenplum数据库(GPDB)初识的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习笔记(十二)计算学习理论
- 下一篇: 【正一专栏】第1球和第500球价值一样