Spark Streaming结合Flume和Kafka的日志分析是怎样的
发表于:2025-01-22 作者:千家信息网编辑
千家信息网最后更新 2025年01月22日,今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。S
千家信息网最后更新 2025年01月22日Spark Streaming结合Flume和Kafka的日志分析是怎样的
今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
Spark Streaming结合Flume、Kafka的日志分析
1.修改相应的配置文件
按照 http://my.oschina.net/sunmin/blog/692994
整合安装Flume+Kafka+SparkStreaming
将flume/conf/producer.conf将需要监控的日志输出文件修改为本地的log 路径:/var/log/nginx/www.eric.aysaas.com-access.log
2.导入相关 jar 包
(快捷键 Ctrl + Alt + Shift + s),点击Project Structure界面左侧的"Modules"显示下图界面
jar 包自己编译,或者去载 http://search.maven.org/#search|ga|1|g%3A%22org.apache.spark%22%20AND%20v%3A%221.6.1%22
3.新建log/KafkaTest.scala 代码如下
import kafka.serializer.StringDecoderimport org.apache.spark.SparkConfimport org.apache.spark.streaming.dstream.DStreamimport org.apache.spark.streaming.{Seconds, StreamingContext}import org.apache.spark.streaming.kafka.KafkaUtils/** * flume+kafka+SparkStreaming 实时 nginx 日志获取 * Created by eric on 16/6/29. */object KafkaLog { def main(agrs: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local[1]").setAppName("StreamingTest") val ssc = new StreamingContext(sparkConf, Seconds(20))//代表一个给定的秒数的实例 val topic = "HappyBirthDayToAnYuan" val topicSet = topic.split(" ").toSet //用 brokers and topics 创建 direct kafka stream val kafkaParams = Map[String, String]("metadata.broker.list" -> "localhost:9092") //直接从 kafka brokers 拉取信息,而不使用任何接收器. val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder]( ssc, kafkaParams, topicSet ) val lines = messages.map(_._2) lines.print() val words: DStream[String] = lines.flatMap(_.split("\n")) words.count().print() //启动 ssc.start() ssc.awaitTermination() }}
4.Test
访问本地页面产生日志 http://www.eric.aysaas.com/app/admin
在这20秒内总共产生的日志行数为:
看完上述内容,你们对Spark Streaming结合Flume和Kafka的日志分析是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
日志
分析
内容
文件
界面
下图
代码
代表
实例
实时
快捷键
接收器
更多
知识
篇文章
行业
资讯
资讯频道
路径
页面
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
贵州都匀服务器虚拟主机
msa 软件开发
软件开发教育哪个好
支付宝存储服务器安全吗
河北oa软件开发哪家好
重庆app定制软件开发
京东服务器机房
网络技术局域网图
ts140服务器虚拟化
网络安全知识竞赛证书电子版
云服务器和电脑速度
网络安全标准化指导思想
交通软件开发定制公司
网络安全密室大逃脱
俄罗斯网络安全中心
鸭脖网络技术培训
租境外服务器的网站
宝坻im即时通讯软件开发
pg数据库搭建
宁波江东豪达网络技术有限公司
数据库动态系统
国家网络安全教育绘画
优居互联网科技
徐汇区数据软件开发创新服务
重庆交易软件开发公司
长沙公安局招聘网络安全
倩女幽魂卡级服务器
储存管理服务器的功能
如何评价软件开发工作量
体彩网络安全月