跳到主要内容

1 篇博文 含有标签「告警中心」

查看所有标签

10 条告警背后其实是 1 个问题,如何高效治理

· 阅读需 12 分钟

10 条里真正该接哪 1 条

发布刚结束,告警列表已经刷出一排红色状态。

主机指标在抖,应用错误率在涨,日志平台也在冒异常,群里几分钟就被不同来源的提醒顶满了。平台排障同学老钱盯着列表,没有立刻去逐条认领。不是他反应慢,而是他知道,这种时候最怕的不是没人看到问题,而是所有人都被 10 条看起来同样着急的告警同时拉走注意力

真正困难的地方,很少是“有没有发现异常”。

真正困难的地方是:这 10 条里,到底哪一条才是处理单位。