5个大数据处理赏罚/数据说明/漫衍式器材
1.Hadoop Hadoop是一个开源框架,它应承在整个集群行使简朴编程模子计较机的漫衍式情形存储并处理赏罚大数据。它的目标是从单一的处事器到上千台呆板的扩展,每一个台机都可以提供当地计较和存储。 2.Druid Druid是及时数据说明存储体系,Java说话中最好的数据库毗连池。Druid可以或许提供强盛的监控和扩展成果。 Druid是一个漫衍式的、面向列的、及时的说明数据存储库,凡是用于为多租户情形中的试探性仪表板供电。 Druid作为一种数据客栈办理方案,善于于对petabyte巨细的数据集举办快速聚合查询。Druid支持各类机动的过滤器、准确计较、近似算法和其他有效的计较。 Druid可以同时加载流数据和批处理赏罚数据,并与Samza、Kafka、Storm、SPark和Hadoop集成。 3.Ambari 大数据平台搭建、监控利器;相同的尚有CDH Ambari可以或许: 提供Hadoop集群
打点Hadoop集群
监督Hadoop集群
4.Spark 一个快速通用的集群计较体系.它在Java、Scala、Python和R中提供了高级API,并提供了支持通用执行图的优化引擎。大局限数据处理赏罚框架(可以应付企业中常见的三种数据处理赏罚场景:伟大的批量数据处理赏罚(batch data processing);基于汗青数据的交互式查询;基于及时数据流的数据处理赏罚,Ceph:Linux漫衍式文件体系。 5.Storm Storm是一个免费开源、漫衍式、高容错的及时计较体系。Storm令一连不绝的流计较变得轻易,补充了Hadoop批处理赏罚所不能满意的及时要求。Storm常常用于在及时说明、在线呆板进修、一连计较、漫衍式长途挪用和ETL等规模。Storm的陈设打点很是简朴,并且,在同类的流式计较器材,Storm的机能也长短常出众的。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |