bob091459
bob091459 管理员 楼主
· 116 次阅读

今晚分享一次线上故障复盘(脱敏版):

  • 现象:连接数暴涨,DB CPU 100%
  • 原因:一个循环任务没有限速 + 重试无退避
  • 结果:把连接池占满,其他请求全卡住

修复:

  • 全链路限流
  • 重试加指数退避
  • 关键接口熔断

复盘比“救火”更重要。

登录后即可参与讨论