草草聊事

消息中间件故障排除 · 系列目录

2026/06/18
2
0

消息中间件故障排除 · 系列目录

叙事框架:业务现象 → 中间件表现 → 根因排查 总计 32 篇,已发布 0 篇,32 篇待完善


RocketMQ 发送端

  • ⏳ RocketMQ 消息发送 system busy / broker busy 根因分析
  • ⏳ 一行代码导致 RocketMQ 大量消息发送失败
  • ⏳ 困扰半年的 RocketMQ timeout exception 破解实录
  • ⏳ 生产环境 autoCreateTopicEnable=true 引发的灾难
  • ⏳ RocketMQ 主题扩分片后消息路由混乱排查

RocketMQ 消费端

  • ⏳ RocketMQ 消息堆积了怎么办?从消费者源码到 OS 层排查
  • ⏳ 顺序消费队列变更导致消息乱序分析
  • ⏳ 消息消费重试机制引发的重复消费问题
  • ⏳ RocketMQ 消费进度丢失排查
  • ⏳ 消费端遇到瓶颈的生产级排查思路

RocketMQ 集群 / HA

  • ⏳ RocketMQ 主从切换引发的消息丢失分析
  • ⏳ DLedger 多副本 Leader 选举失败排查
  • ⏳ RocketMQ NameServer 宕机影响范围分析
  • ⏳ 你部署的 RocketMQ 集群真的是高可用吗?

RocketMQ 存储 / 性能

  • ⏳ RocketMQ CommitLog 文件损坏恢复
  • ⏳ 刷盘机制导致的写入性能瓶颈分析
  • ⏳ 消息文件清除机制引发的磁盘空间问题
  • ⏳ 读写锁在 RocketMQ 中的性能瓶颈排查
  • ⏳ RocketMQ 压测后性能提高 30% 的调优过程

Kafka 发送端

  • ⏳ KafkaProducer Sender 线程异常退出排查
  • ⏳ Kafka 消息发送瓶颈诊断:从哪下手?
  • ⏳ 双十一期间 Kafka 丢消息根因分析

Kafka 消费端

  • ⏳ Kafka 消费者不消费了?Rebalance 全流程定位
  • ⏳ Kafka 重平衡风暴导致消费组卡死
  • ⏳ ISR 频繁伸缩引发性能急剧下降
  • ⏳ Kafka 顺序消费吞吐量下降优化实战

Kafka 集群 / 存储

  • ⏳ Kafka 高水位 HW 推进不动:Leader 选举后脑裂
  • ⏳ Kafka 磁盘写满:日志保留策略配置陷阱
  • ⏳ Kafka 网络连接数打满排查

Kafka 运维 / 架构

  • ⏳ Kafka 消费组运维:一个参数没配好集群崩了
  • ⏳ Kafka 主题分区扩展引发的数据分布不均
  • ⏳ Kafka 时间轮算法:心跳机制导致的性能异常

最后更新:2026-06