首页  思维导图  详情

MQ详解

2021-03-18 15:22:43   36  举报





AI智能生成

MQ详解

redis

作者其他创作

大纲/内容

2.MQ的选型对比

kafka

优势：超高吞吐，可达到10万级别

劣势

天生设计允许丢失数据，保证高吞吐

MQ功能过于简单

也可以使用消息0丢失，但吞吐量会下降

适用场景

大数据领域的用户日志传输，高吞吐，允许数据丢失

RabbitMQ

优势

MQ功能强大

完善的可视化管理工作台

国内大中小公司落地实践案例多

劣势

扛高并发能力较弱

erlang语言开发，不方便改造源码

适用场景

中小型公司业务系统使用，无超高并发场景，无需改造源码

RocketMQ

优势

MQ功能强大

完善的可视化管理工作台

阿里、滴滴、网易等互联网大厂都在用

高并发能力极强

支持数据0丢失的配置

java语言开发，方便改造源码

劣势

官方文档相对简单

适用场景

大中小公司的业务系统

4.RocketMQ底层原理

Broker数据存储机制

为什么Broker数据存储机制是最重要的

commitLog数据存储机制

ConsumeQueue消息offset存储机制

CommitLog写入性能优化

文件顺序追加写入

基于os cache写入

os后台线程异步刷盘

异步刷盘策略

高吞吐，但是会丢失数据

同步刷盘策略

低吞吐，不会丢失数据

Broker读写分离架构原理

CommitLog基于os cache实现写入优化

ConsumeQueue基于os cache实现读取优化

CommitLog基于os cache+磁盘一起读取

CommitLog什么时候从os cache读，什么时候从磁盘读

Master Broker什么时候指示从Slave Broker读

Broker高可用主从架构

基于Dledger管理CommitLog

一组Broker启动时选举leader

Dledger基于Raft协议选举

Raft协议的随机休眠机制

leader可以写入，但是follower不能写入

Leader写入之后进行数据同步

uncommitted消息同步给Follower

过半Follower返回ack即可认为消息写入成功

Dledger在本地执行commit

Dledger将commit消息发送给Follower

Leader崩溃之后

剩余Follower重新选举出Leader

Leader自动热切换

Leader自动完成数据恢复

新Leader继续执行写入任务

producer底层原理

MessageQueue是什么

MessageQueue如何分散在Broker上

写入消息时，如何选择MessageQueue

Broker故障时的容错处理机制

Consumer底层原理

一条消息如何分配给不同的消费组

消费组内部如何分配消息

集群模式

广播模式

MessageQueue如何分配给多台机器消费

如何拉取消息

push模式

pull模式

Broker如何读取数据返回给消费者

基于ConsumeQueue读取消息offset

从CommitLog中读取消息数据

消费者处理消息

回调注册的监听函数来处理

提交消息处理进度

Broker存储consumer的消息Offset

消费组内的重平衡reBalance

消费组内机器宕机

消费组进行机器的扩容

关于MQ使用到的黑科技技术

基于Netty扩展出高性能网络通信架构

基于mmap内存映射实现磁盘文件的高性能读写

RocketMQ相关实践

消息零丢失总体方案

Producer发送消息零丢失方案

RocketMQ事务消息的实现

1.发送half消息（本质上就是需要发送的消息本身），试探MQ

2.若处理逻辑成功，发送对half消息的commit操作指令

3.若处理逻辑失败，则发送rollback操作指令

4.MQ接收half消息成功后，迟迟得不到commit操作指令，则回调补偿生产者，生产者需要对其响应commit或者rollback指令

底层原理详解

正常写入Broker操作流程

1.写入数据到topic，其实是定位到topic中的某个MessageQueue中

2.再定位到某个Broker上，写入该机器上的CommitLog文件中

3.同时将消息索引offset写入到入MessageQueue对应的ConsumeQueue文件

half相关操作流程

1、2相同操作

3.不写入到ConsumeQueue中，而是写入自己内部half_topic中

4.half消息执行commit操作，则在half_topic中标记为commit状态，并将其消息索引写入consumeQueue中

5.half消息执行rollback操作，并不是删除磁盘中commitLog中的数据，而是标记该条消息为rollback状态

6.存在定时任务扫描half消息，不断地去回调补偿生产者，最大尝试次数为15次

Broker存储消息零丢失方案

同步刷盘

Raft协议主从同步

Consumer消息零丢失方案

手动提交offset

自动故障转移

消息零丢失的优势与劣势

优势

劣势

总结

消息重复消费的问题

重复发送（有无必要解决？？）

消费方保证幂等性即可，如每次消费查询数据库中是否已经存在该条数据

消费处理异常的问题

重试队列

死信队列

kafka追求吞吐量，牺牲了大部分MQ功能，如不支持重试、死信队列

消息乱序的问题

生产者发送消息导致乱序

消息者消费消息导致乱序

RocketMQ的数据过滤机制

基于tag和属性过滤

支持比较丰富的数据过滤语法

RocketMQ的延迟队消息机制

生产实践经验之谈

基于tag区分同一topic中不同类型数据

基于消息key来定位消息是否丢失

消息零丢失方案的补充

提高消费者的吞吐量

1.增加consumer机器数量

2.增加consumer的线程数量

3.开启消费者的批量消费功能

RocketMQ集群进行消息轨迹的追踪

broker的配置文件里开启traceTopicEnable=true

producer开启true

consumer开启true

控制台进行查看消息轨迹

1.消息中间件是什么

什么是系统同步调用

什么是系统异步调用

如何通过MQ使用异步调用

MQ的作用是有哪些

异步化提升系统性能

系统解耦

高并发削峰

3.RocketMQ简介

RocketMQ核心原理

架构原理

集群化部署

海量消息分布式存储

高可用：主从架构

数据路由：NameServer

NameServer

Peer集群化部署

Broker无差别注册机制

客户端路由机制

Broker长连接与心跳感知

Broker

Master-Slave同步机制

读写分离机制

Master/Slave宕机后处理

Dledger主从自动切换

RocketMQ生产部署方案

NameServer集群化部署

基于Dledger的Broker主从结构部署

Broker与NameServer通信机制

客户端系统集群部署

核心数据模型：Topic是什么？

Topic如何分布式存储在Broker集群中

生产者与消费者如何与Broker通信

RocketMQ生产级参数调整

os内核参数

jvm参数

中间件核心参数

RocketMQ基础使用

生产者

同步发送消息

异步发送消息--异步发送，回调方法接收

单向消息--不接收返回结果

消费者

Push模式消费者

Pull模式消费者

RocketMQ的源码解析

启动nameServer

启动broker

初始化核心配置

启动Netty服务器去接收网络请求

启动核心组件

启动处理请求的线程池

启动执行后台定时任务的线程池

将自己注册到nameserver上去

关于MQ的一些深度思考

（1）Kafka、RabbitMQ他们有类似的数据分片机制吗？他们是如何把一个逻辑上的数据集合概念（比如一个Topic）给在物理上拆分为多个数据分片的？然后拆分后的多个数据分片又是如何在物理的多台机器上分布式存储的？

（2）为什么一定要让MQ实现数据分片的机制？如果不实现数据分片机制，让你来设计MQ中一个数据集合的分布式存储，你觉得好设计吗？

（3）同步刷盘和异步刷盘两种策略，分别适用于什么不同的场景呢？

（4）异步刷盘可以提供超高的写入吞吐量，但是有丢失数据的风险，这个适用于什么业务场景？在你所知道的业务场景，或者工作接触过的业务场景中，有哪些场景需要超高的写入吞吐量，但是可以适度接受数据丢失？

（5）同步刷盘会大幅度降低写入吞吐量，但是可以让你的数据不丢失，你接触哪些场景，是严格要求数据务必不能丢失任何一条，但是吞吐量并没有那么高的呢？

（6）Kafka、RabbitMQ他们的broker收到消息之后是如何写入磁盘的？采用的是同步刷盘还是异步刷盘的策略？为什么？

（7）每次写入都必须有超过半数的Follower Broker都写入消息才可以算做一次写入成功，那么大家思考一个问题，这样做是不是会对Leader Broker的写入性能产生影响？是不是会降低TPS？是不是必须要在所有的场景都这么做？为什么呢？

（8）一般我们获取到一批消息之后，什么时候才可以认为是处理完这批消息了？是刚拿到这批消息就算处理完吗？还是说要对这批消息执行完一大堆的数据库之类的操作，才算是处理完了？

（9）如果获取到了一批消息，还没处理完呢，结果机器就宕机了，此时会怎么样？这些消息会丢失，再也无法处理了吗？如果获取到了一批消息，已经处理完了，还买来得及提交消费进度，此时机器宕机了，会怎么样呢？

（10）消费者机器到底是跟少数几台Broker建立连接，还是跟所有Broker都建立连接？

（11）RocketMQ是支持主从架构下的读写分离的，那什么时候找Slave Broker读取呢？Kafka、RabbitMQ他们支持主从架构下的读写分离吗？支持Slave Broker的读取吗？为什么呢？

（12）如果支持读写分离的话，有没有一种可能，就是出现主从数据不一致的问题？比如有的数据刚刚到Master Broker和部分SlaveBroker，但是你刚好是从那个没有写入数据的Slave Broker去读取了？

（13）消费吞吐量似乎是跟你的处理速度有很大关系，如果你消费到一批数据，处理太慢了，会导致你严重跟不上数据写入的速度，这会导致你后续几乎每次拉取数据都会从磁盘上读取，而不是os cache里读取，所以你觉得你在拉取到一批消息处理的时候，应该有哪些要点需要注意的？

 收藏

立即使用

spring相关

 收藏

立即使用

JVM原理

 收藏

立即使用

MQ详解

 收藏

立即使用

MySql实战原理

gameqiujing

职业：工程师

去主页





0 条评论

下一页

为你推荐

查看更多



4、Spring详解

mq整体架构

gm-mq

us-mq

美国职业棒球大联盟+(MLB)+详解：运作方式、经典比赛和传奇球员