Spark Streaming结合Flume和Kafka的日志分析是怎样的
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。S
千家信息网最后更新 2025年02月23日Spark Streaming结合Flume和Kafka的日志分析是怎样的
今天就跟大家聊聊有关Spark Streaming结合Flume和Kafka的日志分析是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
Spark Streaming结合Flume、Kafka的日志分析
1.修改相应的配置文件
按照 http://my.oschina.net/sunmin/blog/692994
整合安装Flume+Kafka+SparkStreaming
将flume/conf/producer.conf将需要监控的日志输出文件修改为本地的log 路径:/var/log/nginx/www.eric.aysaas.com-access.log
2.导入相关 jar 包
(快捷键 Ctrl + Alt + Shift + s),点击Project Structure界面左侧的"Modules"显示下图界面
jar 包自己编译,或者去载 http://search.maven.org/#search|ga|1|g%3A%22org.apache.spark%22%20AND%20v%3A%221.6.1%22
3.新建log/KafkaTest.scala 代码如下
import kafka.serializer.StringDecoderimport org.apache.spark.SparkConfimport org.apache.spark.streaming.dstream.DStreamimport org.apache.spark.streaming.{Seconds, StreamingContext}import org.apache.spark.streaming.kafka.KafkaUtils/** * flume+kafka+SparkStreaming 实时 nginx 日志获取 * Created by eric on 16/6/29. */object KafkaLog { def main(agrs: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local[1]").setAppName("StreamingTest") val ssc = new StreamingContext(sparkConf, Seconds(20))//代表一个给定的秒数的实例 val topic = "HappyBirthDayToAnYuan" val topicSet = topic.split(" ").toSet //用 brokers and topics 创建 direct kafka stream val kafkaParams = Map[String, String]("metadata.broker.list" -> "localhost:9092") //直接从 kafka brokers 拉取信息,而不使用任何接收器. val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder]( ssc, kafkaParams, topicSet ) val lines = messages.map(_._2) lines.print() val words: DStream[String] = lines.flatMap(_.split("\n")) words.count().print() //启动 ssc.start() ssc.awaitTermination() }}
4.Test
访问本地页面产生日志 http://www.eric.aysaas.com/app/admin
在这20秒内总共产生的日志行数为:
看完上述内容,你们对Spark Streaming结合Flume和Kafka的日志分析是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
日志
分析
内容
文件
界面
下图
代码
代表
实例
实时
快捷键
接收器
更多
知识
篇文章
行业
资讯
资讯频道
路径
页面
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
as3 数据库
即时通讯软件开发的几大特点
杭州奔汉互联网科技
工控软件开发能用mac吗
笔记本和服务器单核性能
关系的概念数据库
服务器超过多少度会宕机
服务器可以装多个小程序吗
石家庄软件开发公司电话
服务器 url
复高软件开发有限公司 网站
git 文件服务器
终焉誓约哪个服务器能玩
后人下载软件开发
如何计算服务器并发访问量
根据网络安全关键信息
晋中跑腿app软件开发多少钱
存储服务器录像计划点不开
学院大赛管理系统数据库
网络盒子输入ntp服务器
大数据及网络安全督查
笔记本和服务器单核性能
上饶软件开发人天平均多少钱
vitrle云服务器
数据库表里面的值更新为空
数据库三级选择题是考题库吗
菜鸟裹裹网络技术应用
软件开发 人天
浙江美讯网络技术有限公司
200m带宽服务器