在线日志分析项目解读
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,1,日志的采集从flume agent 上的数据一般分到两条线上一条是kafka 集群 ,后期可以用流式处理(spark streaming 或storm 等等)一条是到hdfs,后期可以用hive处
千家信息网最后更新 2025年01月23日在线日志分析项目解读
1,日志的采集
从flume agent 上的数据一般分到两条线上一条是kafka 集群 ,后期可以用流式处理(spark streaming 或storm 等等)一条是到hdfs,后期可以用hive处理,
业界叫lambda架构 architecture (一般公司的推荐系统,就是用这种架构)
flume-ng agent 采集收集日志后,聚合在一个节点上(也可以不聚合)
为什么要聚合?为什么不直接写到kafka集群?
假如公司规模比较大,有无数个flume节点,这么多都连kafka,会增加复杂度,有个聚合节点(会是多个节点组成,防止单节点挂了),还可以对日志格式统一处理,筛选不要的数据
hdfs 可以永久保存数据,mr 可以处理多久数据都行
kafka 集群数据可以存储一定时间不能长期存储,sparkstreaming 只能处理一定时间访问内数据
storm 流
数据源 nginx 日志,mysql 日志,tomcat 日志等等->
flume ->
kafka 消息件 消息发送到这里缓存数据一段时间 ->
spark streaming+spark sql on yarn cluster (实时计算) -> 存储
1.->redis adminLTE + flask 前端组件 + echarts3 集成到监控的系统上
2.->influxdb 时序分布式数据库 grafana 可视化组件(这两种结合比较好)
(elk kibana )
存储+可视化分析
画图工具
http://www.processon.com/
数据
日志
节点
处理
存储
时间
集群
公司
架构
消息
系统
组件
可视化
分析
复杂
业界
分布式
前端
复杂度
多个
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
虹口区品牌软件开发技术指导
考公要求计算机网络技术类是什么
网络技术主讲专题
观看护苗网络安全课程
公安信息网络安全责任书
蜜蜂源v8数据库
学校网络安全信息登记表
幻塔服务器是谁的
数据库可以几个人共享开启
昌平区技术软件开发平台
做软件开发多少钱一个月
银川商城软件开发报价
远程服务器打不开软件怎么解决
nosql数据库设计工具
用什么软件开发网管工具
电子控制网络技术书
oracle数据库如何存储
计算机网络技术英语单词
数据库url设置时区代码
电脑监测数据库
网络安全配套设施是什么
刀片和机架服务器
软件开发填报表的时候填货物
广州英国专线服务器
数据库客户端安装闪退
蜜蜂源v8数据库
网络安全需要解决哪些问题
昌平区技术软件开发平台
计算机网络安全保险
服务器改造方案