cba谁最厉害前十名

admin · 2008-07-01

01 盛开源代码

  Greenplum数据库于2015年由Pivotal公司开源,按照Apache Licence 2.0答应,官方网站为:

  http://greenplum.org

  代码托管正在GitHub上,链接为:

  https://github.com/greenplum-db/gpdb

  盛开源码一方面可认为数据库用户和开垦职员供应Greenplum数据库源码级的告竣参考,另一方面能够吸引更众的数据库开垦者插手到Greenplum社区维持中。

   02 高扩大性

  Greenplum数据库采取大范畴无同享架构,将众台办事器拼装成壮大的揣度平台,告竣高效的海量并交运算。Greenplum数据库能够援手1000个以上的集群,办理的数据范畴从TB级到PB级,能够餍足大批企业的数据处罚需要。

   03 高查问机能

  Greenplum的高机能不单来自高效的并行处罚框架,另有查问引擎的优化。Greenplum数据库除了援手基于PostgreSQL的查问优化除外,还特意开垦了一个新的查问优化器ORCA。

  ORCA是一款自顶向下的基于Cascades框架的查问优化器,现在曾经成为企业版Greenplum数据库的默许优化器。比拟基于PostgreSQL的查问优化器,ORCA查问优化器能使局限查问的机能擢升10~1000倍。

   04 高可用

  Greenplum供应众级容错机制,确保悉数体系的高可用性。Master节点经由过程Standby Master节点停止备份,每一个数据节点的Primary Segment实例分辨设置一个Mirror Segment实例行动备份,同时确保统一组Primary Segment实例和Mirror Segment实例不正在统一物理机上,从而下降由于宕机而招致数据丧失的危险。

   05 高效资本办理

  Greenplum供应了高效的资本办理机制,按照用户的营业逻辑将资本公道地调配给查问职分,防止查问职分因查问资本亏损而得不到反响。

  Greenplum资本办理要紧征求对并发查问数目的范围,查问履行时内存、CPU资本运用的范围等。Greenplum数据库供应了资本队伍(Resource Queue)和资本组(Resource Group)两种资本办理格式,平常运用处景下采取默许设置便可。

   06 众态存储

  用户能够按照数据热度或许访谒形式的差别运用差别的存储格式,以失掉更好的查问机能。用户可认为一张外遵守必然的条例(比方日期、月份)创筑分区外,一张外的各个子分区外能够运用差别的物理存储格式。

  援手的存储格式征求:

   行存储,数据以行的阵势存储正在数据页里,合适屡次更新的查问; 列存储,数据以列的阵势存储正在数据页里,合适OLAP判辨型查问; 外部外,数据保留正在其余文献系中,如HDFS、S3,数据库只保存元数据音讯。 07 生态完好

  Greenplum数据库领有美满的SQL规范援手,征求SQL92、SQL99、SQL2003以及OLAP扩大,是对SQL规范援手最佳的开源商用数据库体系之一。同时,因为Greenplum数据库基于PostgreSQL,以是也承袭了PostgreSQL看待JDBC、ODBC、C、Python API等接口的援手。

   08 高效数据加载

  Greenplum另有一个极度奇特的功效——GPload并行加载数据,即应承数据从众个文献体系经由过程众个主机上的众个网卡加载数据,从而抵达极度高的数据传输率。笔者已经正在3个节点的集群上并行加载50GB、2亿行记实的数据,仅用时90s。

  别的,Greenplum数据库能够读取和写入众品种型的外部数据源,征求文本文献、XML文献、S3平台文献、Gemfire、Web办事器以及Hadoop生态体系中的HDFS、Hive、HBase、Kafka、Spark等,同时援手数据紧缩以及字符集间的主动转换。

   09 高等数据判辨功效

  Greenplum数据库援手各类进程化编程道话,征求PL/PostgreSQL、PL/R、PL/Python、PL/Java、PL/Perl等道话扩大。正在高等数据判辨方面,经由过程Greenplum数据库的MADlib扩大模块,用户能够很便当地行使MPP架构实现大范畴并行判辨。

   10 优秀的监控办理和运维休会

  Greenplum数据库供应基于Web的可视化用具—Greenplum Co妹妹and Center(简称GPCC)。GPCC能够监控Greenplum数据库体系的机能、集群强壮形态、查问履行及体系资本运用环境,如图2-4所示。

  

  

▲图2-4 Greenplum数据库资本监控核心界面

  对于作家:王春奔忙,资深架构师和数据堆栈专家,现任上海启低音讯科技无限公司大数据架构师,Apache Doris和openGauss功绩者,Greenplum中文社区插手者。拥有十众年的数据堆栈、数据集市、数据中台名目实战教训,对大数据主流本领架构、产物选型与管理计划有深刻探求,加倍善于用文雅的SQL告竣纷乱的逻辑。

  本文摘编自《高效运用Greenplum:初学、进阶与数据中台》,经出书方受权公布。(ISBN:9787111696490)

文章推荐:

2022 年中国人工智能行业发展现状与市场规模分析 市场规模超 3000 亿元

该来的总要来! 切尔西老板将彻底退出英国市场

雷神黑武士四代开售:i7搭RTX3060不到9千元

智慧城市中 5G 和物联网的未来