千家信息网

Storm基本概念是什么

发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,这篇文章主要讲解了"Storm基本概念是什么",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Storm基本概念是什么"吧!1、Storm基本概念:Nim
千家信息网最后更新 2025年02月03日Storm基本概念是什么

这篇文章主要讲解了"Storm基本概念是什么",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Storm基本概念是什么"吧!

1、Storm基本概念:

Nimbus:负责资源分配和任务调度

Supervisor:负责Nimbus分配的任务,启动和停止属于自己管理的worker进程

Worker:运行具体处理逻辑的组件进程

Spout/Bolt(Task):worker中每一个(Spout/Bolt)线程称为一个Task,在storm0.8版本之后,task不再与物理线程对应,同一个Spout/Bolt的Task可能共享一个物理线程,该线程称为executor

Topology:所有组件(即Spouts/Bolts)的排列与连接被称之为一个Topology

Spout:产生源数据流的组件

Bolt:接收、执行数据的组件

Tuple:消息传递的基本单元(将消息放在Tuple中进行传输)

Stream:源源不断的传递的Tuple组成了Stream

数据处理的过程:

处理工作被分派给不同类型的组件(components),每个组件分别负责一个简单、特定的处理任务。处理Storm集群输入流的组件叫喷口(spout),喷口再将数据传给一个叫螺栓(bolt)的组件,并在螺栓中处理数据,处理完成之后,螺栓要么将这些数据存储起来(存储在数据库、磁盘甚至是对象中),要么将它传给其他螺栓。因此,可以将Storm集群想象成一个螺栓链,每个螺栓都会对喷口发送的数据作出一些处理。

2、Storm特性(优势/好处)

编程简单、支持多种语言编程、容错、可扩展、可靠、快速、事务性

与其它实时计算系统(s4, puma)的区别

记录级容错:告知用户每一个消息单元是否在指定的时间内被完全处理(消息单元是否完全经过Topology每一个Bolt组件的处理)

1、Spout在发送一个新源时会为Tuple指定一个Message Id(这个MessageId可以是任意对象)

2、Topology中有一个系统级组件叫acker,acker追踪每一个从Spout中绑定MessageId所流出来的若干个Tuple的处理路径

3、如果用户设置的最大超时时间内这些tuple没有被完全处理,那么acker就会告知spout该消息处理失败了,相反则会告知spout该消息处理成功了

事务拓扑(Transactional Topology):storm0.7版本引入的新特性,在0.8版本替换为Trident,在0.9版本弃用,目的是为了满足对消息处理有着极其严格要求的场景,例如实时计算某个用户的成交笔数,要求结果完全精确,不能多也不能少。

感谢各位的阅读,以上就是"Storm基本概念是什么"的内容了,经过本文的学习后,相信大家对Storm基本概念是什么这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

处理 组件 数据 消息 螺栓 概念 版本 线程 任务 单元 用户 学习 事务 内容 实时 对象 时间 物理 特性 系统 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全千人 公安部 绵阳金惠科技互联网 软件开发应用标书 软件开发报告书题目 浙江杰拉网络技术有限 数据库有几个物理层 软件开发商家可以入驻亚马逊吗 创辉恒信北京网络技术 电商公司服务器数据安全性 软件开发关于扫描枪设备检测 上海百朋互联网科技有限公司 叙述软件开发的产品设计过程 网络服务器配置过程中遇到的问题 大学生论文带数据库 服务器登录注册表怎么更改 珠海软件开发工程 lidc数据库怎样下载 宁夏政务软件开发需要多少钱 网络安全注意问题有哪些 物流软件开发设计 健康连线网络技术有限公司 2018网络安全板块 老头环突然连接不上服务器 一般服务器硬盘内存有多大 传奇三怎么从后台进数据库 潍坊配货站开票软件开发 山东省瑞希互联网科技有限公司 钓鱼杯国际网络安全大赛 合肥市智慧监管平台网络安全中标 画数据库图工具
0