你好,我是 Ai拆代码的曹操,一名一直在生产的 Java 后端工程师。
这个博客记录我过去 10 多年一线工作中遇到的真实线上问题、排查过程与解决方案。
目前已规划 12 个系列、462 个案例,16 篇已发布,持续更新中。
| # | 系列 | 案例数 | 已发布 | 进度 |
|---|---|---|---|---|
| 1 | 线上问题实战录 | 58 | 15 | ███▰▰▰▰▰▰▰▰▰ 26% |
| 2 | Spring Boot 生产配置实战 | 30 | 1 | ▰▰▰▰▰▰▰▰▰▰▰▰ 3% |
| 3 | Java 并发疑难杂症 | 26 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 4 | JVM 性能调优 | 20 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 5 | 消息中间件故障排除 | 32 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 6 | SQL 与数据库排障 | 37 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 7 | 网络排查案例集 | 39 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 8 | Linux 系统排查基本功 | 52 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 9 | K8s 与云原生故障排查 | 78 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 10 | 源码级排障 | 40 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 11 | 面试转生产场景 | 29 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
| 12 | 体系化知识专题 | 21 | 0 | ▰▰▰▰▰▰▰▰▰▰▰▰ 0% |
CPU 飙高、OOM、FullGC、死锁、日志风暴——每篇都是真实线上事故的完整复盘,从现象到根因到修复再到预防措施。
连接池爆满、事务失效、AOP 代理绕过、序列化血案——为什么 Dev 环境好好的,上线就炸了?这里有你需要的答案。
线程 Dump 读不懂?ThreadLocal 内存泄漏?CompletableFuture 超时?Java 并发的疑难杂症,一篇一篇攻破。
G1 还是 ZGC?堆外内存怎么查?Safepoint 是什么?从 GC 日志到诊断工具,JVM 调优的决策树型指南。
RocketMQ 消息堆积、Kafka 重平衡风暴、Broker 繁忙——消息中间件故障的根因分析与可复用排查清单。
一个慢 SQL 打垮全站、死锁分析、主从延迟、分库分表跨节点 JOIN、Redis 缓存穿透——数据库排障全领域覆盖。
TCP 握手丢包、tcpdump 抓包、iptables 规则、DNS 解析慢、SSL 证书——网络排查方法论,套路化解决。
CPU 节流、内存泄漏、磁盘 IO 排队、OOM Killer、strace/perf/eBPF——应用层查不下去时,下钻 OS 层。
Pod 频繁重启、Service 不通、etcd 性能瓶颈、CNI 排障、HPA 不灵敏——K8s 与云原生故障全指南。
Dubbo 调不通、Sentinel 限流不生效、Netty 内存泄漏、MyBatis 缓存脏读——不看源码就排不了的疑难。
ThreadLocal 面试答对了,生产 OOM 你知道吗?面试题 × 生产事故 = 真正的技术深度。
架构设计、性能调优、方法论、全链路排障——深度长文,一篇顶十篇,构建 Java 工程师的体系化知识结构。
最后更新:2026-06