导航：首页 > 互联网科技 >

kafka背景及架构如何理解

发表于：2024-11-27 作者：千家信息网编辑

千家信息网最后更新 2024年11月27日，这篇文章给大家介绍kafka背景及架构如何理解，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。背景及架构介绍一、背景什么是kafka呢，他是LinkedIn开发的一个分布式消息系

千家信息网最后更新 2024年11月27日kafka背景及架构如何理解

这篇文章给大家介绍kafka背景及架构如何理解，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。

背景及架构介绍

一、背景

什么是kafka呢，他是LinkedIn开发的一个分布式消息系统，用scala编写的，可以水平扩展和高吞吐率。

原本开发自LinkedIn，用作他们的活动流和运营数据处理管道的基础，之后被多家公司使用，慢慢发展壮大起来。

二、简单介绍

kafka是分布式的，基于发布/订阅的消息系统。

1、即使对TB级以上数据也能保证常数时间复杂度的访问性能。

2、高吞吐率：即使在非常廉价的商用机器上也能做到单机支持每秒100k条以上消息的传输。

3、支持分区，消息分布式消费，但是只能保证每个partition内的消息顺序传输。并且支持在线水平扩展。

为何使用消息中间件呢，大家肯定接触过rabbitmq、activemq、redis等，估计有很多感触。我就不详细描述了，这个只能亲身参加过大的技术架构，自己身在其中，并且感受到不用消息中间件和用的区别。

三、架构

了解架构之前，我们先了解一下基本名词。

Broker：安装了kafka的服务器就是一个broker。

Topic：消息的类比，最好一类数据定一个topic去存储传输。

Partition:分区，topic可以定分到几个分区中。

Producer：发送消息，发送者。

Consumer：消费消息，消费者。

Consumer Group：每个Consumer属于一个特定的Consumer Group。

从图中来看，kafka集群包含若干个producer和consumer以及broker，还有一个zk集群。Producer通过push模式将数据发送到broker，Consumer通过pull模式拉取数据。

Producer发送消息到broker时，根据partition机制选择分不到哪一个partition，设置合理的情况下，所有消息可

以均匀分不到不同的partition里，实现了负载均衡。

关于kafka背景及架构如何理解就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

千家信息网