kafka节点假死
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,一、前言早上醒来打开微信,同事反馈kafka集群从昨天凌晨开始写入频繁失败,赶紧打开电脑查看了kafka集群的机器监控,日志信息,发现其中一个节点的集群负载从昨天凌晨突然掉下来了,和同事反馈的时间点大
千家信息网最后更新 2025年02月23日kafka节点假死
一、前言
早上醒来打开微信,同事反馈kafka集群从昨天凌晨开始写入频繁失败,赶紧打开电脑查看了kafka集群的机器监控,日志信息,发现其中一个节点的集群负载从昨天凌晨突然掉下来了,和同事反馈的时间点大概一致,于是乎就登录服务器开始干活。
二、排错
1、查看机器监控,看是否能大概定位是哪个节点有异常
2、根据机器监控大概定位到其中一个异常节点,登录服务器查看kafka日志,发现有报错日志,并且日志就停留在这个这个时间点:
[2017-06-01 16:59:59,851] ERROR Processor got uncaught exception. (kafka.network.Processor)java.lang.OutOfMemoryError: Direct buffer memory at java.nio.Bits.reserveMemory(Bits.java:658) at java.nio.DirectByteBuffer.(DirectByteBuffer.java:123) at java.nio.ByteBuffer.allocateDirect(ByteBuffer.java:306) at sun.nio.ch.Util.getTemporaryDirectBuffer(Util.java:174) at sun.nio.ch.IOUtil.read(IOUtil.java:195) at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:379) at org.apache.kafka.common.network.PlaintextTransportLayer.read(PlaintextTransportLayer.java:108) at org.apache.kafka.common.network.NetworkReceive.readFromReadableChannel(NetworkReceive.java:97) at org.apache.kafka.common.network.NetworkReceive.readFrom(NetworkReceive.java:71) at org.apache.kafka.common.network.KafkaChannel.receive(KafkaChannel.java:160) at org.apache.kafka.common.network.KafkaChannel.read(KafkaChannel.java:141) at org.apache.kafka.common.network.Selector.poll(Selector.java:286) at kafka.network.Processor.run(SocketServer.scala:413)
3、查看kafka进程和监听端口情况,发现都正常,尼玛假死了
ps -ef |grep kafka ## 查看kafka的进程netstat -ntlp |grep 9092 ##9092kafka的监听端口
4、既然已经假死了,只能重启了
ps -ef |grep kafka |grep -v grep |awk '{print $2}' | xargs kill -9 /usr/local/kafka/bin;nohup ./kafka-server-start.sh ../config/server.properties &
5、重启后在观察该节点的kafka日志,在一顿index重建之后,上面的报错信息在疯狂的刷,最后谷歌一番,解决了该问题
三、解决方案:
在
/usr/local/kafka/binkafka-run-class.sh
去掉
-XX:+DisableExplicitGC
添加
-XX:MaxDirectMemorySize=512m
在一次重启kafka,问题解决。
PS:参考链接:http://ju.outofmemory.cn/entry/75905
日志
节点
机器
集群
监控
信息
同事
时间
服务器
端口
进程
问题
定位
服务
登录
监听
频繁
一致
疯狂
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
机器人需要软件开发吗
openwrt 监控服务器
贵州的网络安全竞赛
t730 服务器管理软件
数据库报错213
华硕x99能上服务器内存
凯度网络技术有限公司
无线领域软件开发
分布式至少几台服务器
oracle数据库没有挂载
宁波施工管理软件开发
oracle数据库启用归档
表格中的重复的数据库
殷锋社 计算机网络技术
儿童医疗开放数据库
政府资助教育软件开发
网络安全措施图片
手机软件开发视频
对软件开发的管理
北京智能软件开发概念设计
腾讯公司的软件开发人员收入
梦幻西游如何重启服务器
信也科技互联网保险规划师
韩国ibm服务器租用
网络安全技术转让平台
贵州省网络安全线上知识竞答题目
关于网络安全周的插图
软件开发过程QG
11g删除数据库实例
数据库项目管理师培训