消息队列之kafka(基础介绍)
一、关于JMS
1. JMS 的基础
JMS是Java提供的一套技术规范。即Java消息服务(Java message service)。应用程序接口。是一个Java平台中关于面向消息中间件的API。用于在两个应用程序之间或者分布式系统中发送消息,进行异步通信。Java消息服务是一个与具体平台无关的API。
用来异构系统集成通信,缓解系统瓶颈。 提高系统的伸缩性、增强系统用户体验。使得系统模块化和组件化变得可行并更加灵活。
JAVA2EE十三大规范:https://blog.csdn.net/qq_41637061/article/details/84640947
2. JMS消息传输模型
(1)点对点
点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息推送到客户端。这个模型的特点是发送到队列的消息被一个且只有接受者接受处理,即使有多个消息监听者也是如此。总的来说就是:一对一,消费者主动拉取数据,消息收到后消息清除
(2) 发布/订阅模式
发布订阅模型则是一个基于推送的消息传送模型。发布订阅模型可以有多种不同的订阅者,临时订阅者只在主动监听主题时才接收消息,而持久订阅者则监听主题的所有消息,即时当 前订阅者不可用,处于离线状态。
3.JMS 核心组件
Destination:消息发送的目的地,也就是前面说的Queue 和 Topic。
Message:从字面上就可以看出来是被发送的消息。
Producer:消息的生产者,发送一个消息,必须通过这个产生者来发送。
MessageConsumer:与生产者相对应,这是消息的消费者或接收者,通过它来接收一个消息。
其中 message有分为很多种类:
StreamMessage:Java 数据流消息,用标准流操作来顺序的填充和读取。
MapMessage:一个 Map 类型的消息;名称为 string 类型,而值为 Java 的基本类型。
TextMessage:普通字符串消息,包含一个 String。
ObjectMessage:二进制数组消息,包含一个 byte[]。
XMLMessage:一个 XML 类型的消息。
其中最常用的就是TextMessage 和 ObjectMessage。
4.常见的消息队列服务
(1) ActiveMQ
ActiveMQ 是 Apache 出品,最流行的,能力强劲的开源消息总线。ActiveMQ 是一个完全支 持 JMS1.1 和 J2EE 1.4 规范的。
特点:
- 生产者、服务器和消费者都可分布
- 消息存储顺序写
- 性能极高,吞吐量大
- 支持消息顺序
- 客户端 pull,随机读,利用 sendfile 系统调用,zero-copy ,批量拉数据
- 支持消费端事务
- 支持消息广播模式
- 支持异步发送消息
- 支持 http 协议
- 数据迁移、扩容对用户透明
- 支持同步和异步复制两种 HA
(2) RocketMQ
RocketMQ 是一款分布式、队列模型的消息中间件
特点:
- 能够保证严格的消息顺序
- 提供丰富的消息拉取模式
- 高效的订阅者水平扩展能力
- 实时的消息订阅机制
- 亿级消息堆积能力
二、kafka的基础介绍
1. Kafka 的介绍
kafak是一种分布式的,基于发布/订阅的消息系统。以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间复杂度的访问性能。 高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条以上消息的传输。支持Kafka Server间的消息分区,及分布式消费,同时保证每个Partition内的消息顺序传输。同时支持离线数据处理(hive、HBASE)和实时数据处理(spark、storm)。
2.kafka的优势
- 解耦:允许独立的扩展或者修改两边的处理过程,只要确保他们遵循同样的接口约束。
- 冗余:消息队列把数 据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险。直到保存到使用完毕。
- 扩展性:增大消息入队和处理的频率是很容易
- 灵活性&峰值处理能力:消息队列能够 使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。
- 可恢复性:系统的一部分组件失效时,不会影响到整个系统。
- 顺序保证:Kafka 保证一个 Partition 内的消息的有序性。
- 缓冲:消息队列通过一个缓冲层来帮助任务最高效率的执行。写入队列的处理 会尽可能的快速。该缓冲有助于控制和优化数据流经过系统的速度。
- 异步通信:消息队列提供了异步处理机制,允许用户把一个消息放入队列,但并不立即处理它。(想放多少放多少,需要的时候在处理)
3.kafka的特性
- 高吞吐、低延迟:kafka 每秒可以处理几十万条消息,它的延迟最低只有几毫秒。
- 可扩展性:kafka 集群支持热扩展
- 可靠性:消息被持久化到本地磁盘,并且支持数据备份防止数据丢失
- 容错性:允许集群中节点失败
- 高并发:支持数千个客户端同时读写
4.kafka的应用场景
经典架构:Flume + Kafka + Storm /spark streaming+ Redis。
应用场景:消息系统、跟踪网站活动、运营指标、日志聚合、流处理、采集日志、提交日志。