Apache、Cloudera、Hortonworks是公司名称,这三家公司有如下大数据产品:
Apache:Avro 、Cassandra、Chukwa、HBase、Hive、Mahout、Pig、Spark、Tez、ZooKeeper。
(这一系列 我理解为hadoop的生态圈其中包括ambari和cdh在内的其他厂商开发的数据产品)Cloudera:cdh、cm
Hortonworks:hdp、ambari 其中Apache的hadoop生态圈、Cloudera的cdh、Hortonworks的ambari是完全开源的,下图为官方提供的一套大数据技术结构图:
打算对新建的集群使用管理工具,列了以下主要的不同点:
主要的不同点 | apache Ambari | ClouderaManager Express(免费版) |
---|---|---|
配置版本控制和历史记录 | 支持 | 不支持 |
二次开发 | 支持 | 不支持 |
集成 | 支持 | no (不支持redis、kylin、es) |
维护 | 依靠社区力量 | cloudera做了一些定制开发,自行维护或打patch会离社区越来越远 |
权限控制 | ranger(相对简单) | sentry(复杂) |
视图定制 | 支持创建自己的视图,添加自定义服务 | 不支持 |