告警处理流程及责任分配与闭环总结
该思维导图展示了告警处理流程,包括值班人员的监控方式、告警内容的分类以及闭环处理。在监控阶段,值班人员通过研发云、移动办公群、短信和语音电话接收告警,并在1分钟内识别告警内容。告警内容分为系统告警和业务告警,针对不同类型的告警,采取相应的反馈和处理措施,确保及时处理并评估优化需求,最终实现闭环管理。
源码
# 告警处理流程及责任分配与闭环总结
## 值班人员监控
- 渠道
- 研发云
- 移动办公群
- 短信
- 语音电话
- 识别告警内容
- 时间限制: 1分钟内
- 确认告警类型
- 系统告警
- 业务告警
## 告警内容分类
- 系统告警
- 反馈处理
- 回复到对应值班群
- 通知应用运维人员
- 建立运维联络
- 应用运维人员
- 调度处理人员
- 识别告警等级
- 严重
- 立即处理
- 主要
- 快速处理
- 一般
- 常规处理
- 处理完毕
- 反馈处理结果
- 更新监控状态
- 评估优化需求
- 记录问题
- 建议优化
- 业务告警
- 通知
- 开发人员
- 外部系统人员
- 全网监控人员
- 业务监控人员
- 跟进处理进展
- 识别影响范围
- 关键业务
- 常规业务
- 涉及运维操作
- 重启服务
- 扩容服务
- 应用运维参与配合
## 闭环
- 结果总结
- 处理时效
- 成功率评估
- 问题记录和跟踪
- 优化建议
- 更新处理流程
- 提升监控工具
- 定期评审
图片
