logstash将Kafka中的日志数据订阅到HDFS
发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,前言:通常情况下,我们将Kafka的日志数据通过logstash订阅输出到ES,然后用Kibana来做可视化分析,这就是我们通常用的ELK日志分析模式。但是基于ELK的日志分析,通常比较常用的是实时分
千家信息网最后更新 2025年01月24日logstash将Kafka中的日志数据订阅到HDFS
前言:通常情况下,我们将Kafka的日志数据通过logstash订阅输出到ES,然后用Kibana来做可视化分析,这就是我们通常用的ELK日志分析模式。但是基于ELK的日志分析,通常比较常用的是实时分析,日志存个十天半个月都会删掉。那么在一些情况下,我需要将日志数据也存一份到我HDFS,积累到比较久的时间做半年、一年甚至更长时间的大数据分析。下面就来说如何最简单的通过logstash将kafka中的数据订阅一份到hdfs。
一:安装logstash(下载tar包安装也行,我直接yum装了)
#yum install logstash-2.1.1
二:从github上克隆代码
#git clone https://github.com/heqin5136/logstash-output-webhdfs-discontinued.git#lslogstash-output-webhdfs-discontinued
三:安装logstash-output-webhdfs插件
#cd logstash-output-webhdfs-discontinuedlogstash的bin目录下有个plugin,使用plugin来安装插件#/opt/logstash/bin/plugin install logstash-output-webhdfs
四:配置logstash
#vim /etc/logstash/conf.d/logstash.confinput { kafka { zk_connect => '10.10.10.1:2181,10.10.10.2:2181,10.10.10.3:2181' #kafka的zk集群地址 group_id => 'hdfs' #消费者组,不要和ELK上的消费者一样 topic_id => 'apiAppWebCms-topic' #topic consumer_id => 'logstash-consumer-10.10.8.8' #消费者id,自定义,我写本机ip。 consumer_threads => 1 queue_size => 200 codec => 'json' }}output { #如果你一个topic中会有好几种日志,可以提取出来分开存储在hdfs上。if [type] == "apiNginxLog" { webhdfs { workers => 2 host => "10.10.8.1" #hdfs的namenode地址 port => 50070 #webhdfs端口 user => "hdfs" #hdfs运行的用户啊,以这个用户的权限去写hdfs。 path => "/data/logstash/apiNginxLog-%{+YYYY}-%{+MM}-%{+dd}/logstash-%{+HH}.log #按天建目录,按小时建log文件。 flush_size => 500# compression => "snappy" #压缩格式,可以不压缩 idle_flush_time => 10 retry_interval => 0.5 } }if [type] == "apiAppLog" { webhdfs { workers => 2 host => "10.64.8.1" port => 50070 user => "hdfs" path => "/data/logstash/api/apiAppLog-%{+YYYY}-%{+MM}-%{+dd}.log" flush_size => 500# compression => "snappy" idle_flush_time => 10 retry_interval => 0.5 } } stdout { codec => rubydebug }}
五:启动logstash
#/etc/init.d/logstash start
已经可以成功写入了。
日志
分析
数据
消费者
消费
订阅
地址
常用
情况
插件
用户
目录
成功
下有
代码
前言
半年
实时
小时
就是
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
校园超市收入数据库
部门网络安全建设情况
怎么知道软件开发作者
软件开发劳务派遣多少钱
vc面向对象数据库开发
同一堂网络安全课
软件开发什么型号的pc合适
云服务器如何加在本地电脑桌面上
网络技术有什么好
怎么检查数据库有没有问题
企业管理器无法导入数据库
isc网络安全吗
守护网络安全构建和谐校园观后感
黄陂民宿软件开发
电脑版微信读取sql数据库
网络安全硬件市场
MDB数据库递归
软件开发什么语言比较主流
软件开发进阶系列教学视频
搜一遍关于网络安全的手抄报
数据库技术与应用笔记
如何同步sql数据库指定表
浦东新区市场软件开发管理系统
同一堂网络安全课
宜宾软件开发怎么样
荆州网络安全技术改造项目
怎么样才可以超过服务器的极限
生活中需要注意的网络安全问题
北京办理服务器托管流程
黑哥哥软件开发基地