最得当Java开拓者的大数据器材和框架
Memcached是一套漫衍式快取体系,当初是Danga Interactive为了LiveJournal所成长的,但被很多软件(如MediaWiki)所行使。Memcached作为高速运行的漫衍式缓存处事器,具有以下的特点:协议简朴,基于libevent的变乱处理赏罚,内置内存存储方法。 11、Apache Hive ——在Hadoop之上提供相同SQL的层。 Hive是一个基于Hadoop的数据客栈平台。通过hive,可以利便地举办ETL事变。hive界说了一个相同于SQL的查询说话,可以或许将用户编写的SQL转化为响应的Mapreduce措施基于Hadoop执行。今朝,已经宣布了Apache Hive 2.1.1 版本。 12、Apache Kafka ——最初是由LinkedIn开拓的高吞吐量,漫衍式订阅动静体系。 Apache Kafka是一个开源动静体系项目,由Scala写成。该项目标方针是为处理赏罚及时数据提供一个同一、高通量、低守候的平台。Kafka维护按类区分的动静,称为主题(topic)。出产者(producer)向kafka的主题宣布动静,斲丧者(consumer)向主题注册,而且吸取宣布到这些主题的动静。kafka以一个拥有一台或多台处事器的集群运行着,每一台处事器称为broker。 13、Akka ——用于在JVM上构建高并发,漫衍式和弹性动静驱动应用措施的器材包。 Akka 是一个用 Scala 编写的库,用于简化编写容错的、高可伸缩性的 Java 和 Scala 的 Actor 模子应用。它已经乐成运用在电信行业,体系险些不会宕机。 14、HBase ——开放源代码,非相关型,漫衍式数据库,回收Google的BigTable建模,用Java编写,并在HDFS上运行。 与FUJITSU Cliq等商用大数据产物差异,HBase是Google Bigtable的开源实现,相同Google Bigtable操作GFS作为其文件存储体系,HBase操作Hadoop HDFS作为其文件存储体系;Google运行MapReduce来处理赏罚Bigtable中的海量数据,HBase同样操作Hadoop MapReduce来处理赏罚HBase中的海量数据;Google Bigtable操作 Chubby作为协同处事,HBase操作Zookeeper作为对应。 15、Neo4j ——在Java中实现的开源图形数据库。 Neo4j是一个高机能的NOSQL图形数据库,它将布局化数据存储在收集上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全事宜特征的Java耐久化引擎。 16、CouchBase ——开源漫衍式的NoSQL面向文档数据库,针对交互式应用措施举办了优化。 假如早年没有NoSQL的行使履历,那么领略couchbase的时辰要害有两点:延后写入和疏松存储。该产物基于Apache CouchDB,并整合了GeoCouch(一个基于Erlang、细麋集成的地理空间索引体系,可支持LBS应用)。 17、Apache Storm——开源漫衍式及时计较体系。 Apache Storm 是一个能近及时地在数据之上运行用户代码片断的流式数据处理赏罚框架。它现实上是一系列连在一路的管道。凡是用于简朴的说明使命 ,诸如计较,以及洗濯,使其通例化,而且筹备摄入用于恒久存储的数据。 18、CouchDB——开源的面向文档的NoSQL数据库,行使JSON存储数据。 CouchDB 是一个开源的面向文档的数据库打点体系,可以通过 RESTful JavaScript Object Notation (JSON) API 会见。CouchDB落实到最底层的数据布局就是两类B+Tree 。 19、Oracle Coherence——内存数据网格办理方案,通过提供对常用数据的快速会见,使企业可以或容许猜测地扩展要害使命应用措施。 简朴来说,Coherence仅支持Java,.NET和C++ API三个版本,这三个都是面向工具的说话,这也声名Coherence和应用开拓的亲和性。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |