Apache Kafka和Flume之间的区别

Kafka和Flume都用于实时事件处理系统。它们都是由Apache开发的。Kafka是一个发布-订阅模型消息传递系统。可以使用主题在发布者和订阅者之间进行通信。Kafka的最佳功能之一是,它具有很高的可用性,并且可以抵抗节点故障,并支持自动恢复。

另一方面,水槽主要是为Hadoop设计的,并且是Hadoop生态系统的一部分。它用于从不同来源收集数据并将数据传输到集中式数据存储。Flume的主要设计目的是为了收集从各种Web服务器到HDFS的流数据(日志数据)。

序号阿帕奇·卡夫卡水槽
1
基本的
Apache Kafka是一种分布式数据存储,经过优化可实时摄取和处理流数据
Apache Flume是一个分布式,可靠且可用的系统,用于有效地收集,聚集大量日志数据并将其从许多不同的源移动到集中式数据存储中。
2
        可扩展的
容易扩展
它不能像Kafka一样可扩展
3
推拉
卡夫卡基本上是拉模型  
Flume基本上可以作为推模型  
4
复苏
它具有很高的可用性,并且可以抵抗节点故障,并支持自动恢复
 如果发生水槽代理故障,您将丢失通道中的事件
5,
灵活性
Kafka是通用的发布-订阅模型消息传递系统
专为Hadoop设计