草草聊事

网络排查案例集 · 系列目录

2026/06/18
3
0

网络排查案例集 · 系列目录

叙事框架:网络问题套路化排查方法论 总计 39 篇,已发布 0 篇,39 篇待完善


一、TCP 连接类

  • ⏳ 客户端报连接超时、服务端说没收到——TCP 握手丢包分析
  • ⏳ TCP 连接异常断开:RST 包出现的原因与全链路定位
  • ⏳ 一次 keepalive 配置不当导致连接泄漏
  • ⏳ TCP 半连接队列满导致大量连接超时
  • ⏳ TIME_WAIT 过多导致端口资源耗尽
  • ⏳ TCP 全连接队列溢出:listen 的 backlog 参数设错了吗?
  • ⏳ TCP 重传率飙升排查:从应用层到物理层逐层找原因

二、抓包 / 诊断类

  • ⏳ tcpdump 从入门到生产实战:一条命令一条命令学
  • ⏳ Unix Domain Socket 如何抓包?进程间通信可视化
  • ⏳ 用 Wireshark 分析一次慢请求的 TCP 序列——真的不是代码问题
  • ⏳ 网络延迟突增:从 ping 到 mtr 到 tcpdump 逐层定位
  • ⏳ 网络性能指标看不懂?带宽/吞吐/PPS/延迟一次说清楚

三、iptables / 防火墙类

  • ⏳ iptables 规则写错导致生产服务不可访问
  • ⏳ iptables 规则太多导致网络性能下降
  • ⏳ 容器网络不通?从 CNI 到 iptables 逐层排查
  • ⏳ 安全组/防火墙策略导致跨环境调用失败
  • ⏳ 网络策略导致跨命名空间服务调用失败(K8s NetworkPolicy)

四、DNS / HTTP / SSL 类

  • ⏳ DNS 解析慢导致接口首次访问超时
  • ⏳ DNS 解析结果不一致:本地 dig 正常、线上就是不行
  • ⏳ HTTPS 证书过期?从 SSL 握手序列到证书链验证
  • ⏳ HTTP 长连接 Keepalive 配置不当导致连接泄漏
  • ⏳ HTTP/2 多路复用导致连接阻塞排查
  • ⏳ Nginx 反向代理 502 排查全流程:从 upstream 到 keepalive
  • ⏳ Nginx 限流配置不当导致正常请求被拦截
  • ⏳ CDN 回源超时排查:到底是用户网络还是源站问题
  • ⏳ 负载均衡器会话保持失效排查
  • ⏳ 代理(正向/反向)配置错误导致请求异常

五、网络性能类

  • ⏳ 带宽打满了怎么办?从网卡指标到流量分析
  • ⏳ C10K 到 C1000K:连接数增长后性能突降的底层原因
  • ⏳ 网络 MTU 不一致导致分片丢包
  • ⏳ TCP 拥塞控制算法 BBR vs Cubic:选型与生产调优
  • ⏳ 多网卡 Bonding 模式选错导致的网络不稳定
  • ⏳ 跨区域/跨机房网络延迟问题定位

六、应用协议类

  • ⏳ gRPC 长连接保活机制导致连接泄露排查
  • ⏳ WebSocket 连接频繁断开:从心跳到代理超时
  • ⏳ UDP 通信频繁丢包:应用层可靠传输的必要性

七、网络虚拟化类

  • ⏳ 容器网络性能排查:veth/bridge/overlay 每层开销分析
  • ⏳ 网络虚拟化 VLAN/VXLAN 配置错误排查
  • ⏳ K8s Service 访问不通:iptables/IPVS 逐层排查

最后更新:2026-06