加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

81个开源大数据处理赏罚器材汇总(上),包罗查询引擎/流式计较/存储

发布时间:2021-02-25 21:29:53 所属栏目:大数据 来源:网络整理
导读:本文一共分为上下两部门。我们将针对大数据开源器材差异的用处来举办分类,而且附上了官网和部门下载链接,但愿能给做大数据的伴侣做个参考。下面是第一部门。 查询引擎 一、Phoenix 孝顺者::Salesforce 简介:这是一个Java中间层,可以闪开拓者在Apache H

简介:OceanBase是一个支持海量数据的高机能漫衍式数据库体系,实现了数千亿笔记录、数百TB数据上的跨行跨表事宜,由淘宝焦点体系研发部、运维、DBA、告白、应用研发等部分配合完成。在计划和实现OceanBase的时辰暂且摒弃了不紧张的DBMS的成果,譬喻姑且表,视图(view),研发团队把有限的资源齐集到要害点上,当前 OceanBase首要办理数据更新同等性、高机能的跨表读事宜、范畴查询、join、数据全量及增量dump、批量数据导入。

今朝OceanBase已经应用于淘宝保藏夹,用于存储淘宝用户保藏条目和详细的商品、店肆信息,天天支持4~5万万的更新操纵。守候上线的应用还包罗CTU、SNS等,天天更新高出20亿,更新数据量高出2.5TB,并会慢慢在淘宝内部推广。

OceanBase 0.3.1在Github开源,开源版本为Revision:12336。

官网:http://alibaba.github.io/oceanbase/

二、Amazon?SimpleDB

孝顺者:亚马逊

Amazon SimpleDB是一个分手式数据库,以Erlang撰写。同与Amazon EC2和亚马逊的S3一样作为一项Web 处事,属于亚马逊收集处事的一部门。

81个开源大数据处理赏罚器材汇总(上),包罗查询引擎/流式计较/存储

正如EC2和S3,SimpleDB的凭证存储量,在互联网上的传输量和吞吐量收取用度。 在2008年12月1日,亚马逊推出了新的订价计策,提供了免费1 GB的数据和25呆板小时的自由层(Free Tire)。 将个中的数据转移到其他亚马逊收集处事是免费的。

它是一个可大局限伸缩、用 Erlang 编写的高可用数据存储。

官网:http://aws.amazon.com/cn/simpledb/

三、Vertica

孝顺者:惠普

简介:惠普2011年2月份起始3月21号完成收购Vertica。Vertica基于列存储。基于列存储的计划对比传统面向行存储的数据库具有庞大的上风。同时Vertica支持MPP(massively parallel processing)等技能,查询数据时Vertica只需取得必要的列,而不是被选择行的全部数据,其均匀机能可进步50x-1000x倍。(查询机能高速率快)

Vertica的计划者多次暗示他们的产物环绕着高机能和高可用性计划。因为对MPP技能的支持,可提供对粒度,可伸缩性和可用性的上风。每个节点完全独立运作,完全无共享架构,低落对共享资源的体系竞争。

Vertica的数据库行使尺度的SQL查询,同时Vertica的架构很是得当云计较,包罗假造化,漫衍式多节点运行等,而且可以和Hadoop/MapReduce举办集成。

Vertica官网:http://www.vertica.com/

四、Cassandra

孝顺者:facebook

相干文章:开源漫衍式NoSQL数据库体系——Cassandra? ?Cassandra与HBase的大数据对决 谁是胜者?

简介:Cassandra是一套开源漫衍式NoSQL数据库体系。它最初由Facebook开拓,用于储存收件箱等简朴名目数据,集GoogleBigTable的数据模子与Amazon Dynamo的完全漫衍式的架构于一身Facebook于2008将 Cassandra 开源,从此,因为Cassandra精采的可扩放性,被Digg、Twitter等知名Web 2.0网站所采用,成为了一种风行的漫衍式布局化数据存储方案。

81个开源大数据处理赏罚器材汇总(上),包罗查询引擎/流式计较/存储

Cassandra是一个殽杂型的非相关的数据库,相同于Google的BigTable。其首要成果比Dynamo (漫衍式的Key-Value存储体系)更富厚,但支持度却不如文档存储MongoDB(介于相关数据库和非相关数据库之间的开源产物,长短相关数据库傍边成果最富厚,最像相关数据库的。支持的数据布局很是疏松,是相同json的bjson名目,因此可以存储较量伟大的数据范例)。Cassandra最初由Facebook开拓,后转酿成了开源项目。它是一个收集交际云计较方面抱负的数据库。以Amazon专有的完全漫衍式的Dynamo为基本,团结了Google BigTable基于列族(Column Family)的数据模子。P2P去中心化的存储。许多方面都可以称之为Dynamo 2.0。

Cassandra官网:http://cassandra.apache.org/

?五、HyperTable

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读