Kafka的核心实践是什么
这篇文章将为大家详细讲解有关Kafka的核心实践是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
Kafka的核心实践
1.版本升级
之前大数据平台一直使用的是0.8.3这一Kafka早期版本,而截止到当前,Kafka官方最新的Release版本已经到了2.3,于是长期使用0.8版本过程中渐渐遇到的很多瓶颈和问题,我们是能够通过版本升级来解决的。
举例来说,以下是一些之前使用旧版时常见的问题:
缺少对Security的支持:存在数据安全性问题及无法通过认证授权对资源使用细粒度管理
brokerunderreplicated:发现broker处于underreplicated状态,但不确定问题的产生原因,难以解决。
新的feature无法使用:如事务消息、幂等消息、消息时间戳、消息查询等。
客户端的对offset的管理依赖zookeeper,对zookeeper的使用过重,增加运维的复杂度
监控指标不完善:如topic、partition、broker的数据size指标,同时kafkamanager等监控工具对低版本kafka支持不好
同时对一些目标版本的特性进行了选型调研,如:
0.9版本,增加了配额和安全性,其中安全认证和授权是我们最关注的功能
0.10版本,更细粒度的时间戳.可以基于偏移量进行快速的数据查找,找到所要的时间戳。这在实时数据处理中基于Kafka数据源的数据重播是极其重要的
0.11版本,幂等性和Transactions的支持及副本数据丢失/数据不一致的解决。
1.1版本,运维性的提升。比如当ControllerShutDown,想要关闭一个Broker的时候,之前需要一个很长很复杂的过程在1.0版本得到很大的改善。
最终选择1.1版本,则是因为出于Camus与Kafka版本的兼容性及1.1版本已经满足了使用场景中重要新特性的支持的综合考量。这里再简单说一下Camus组件,同样是由Linkedin开源,在我们的大数据平台中主要作为Kafka数据Dump到HDFS的重要方式。
关于Kafka的核心实践是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。