查看并处理告警

设置告警后,一旦监控对象触发告警,相关人员就会收到告警消息,在“消息列表”页面查看告警事件详情及快照,定位并处理相关问题。

7.4.png

在列表中查看告警发生的时间、监控对象、类型、监控事件、当前状态及持续时间,监控事件时触发告警的条件。

过滤消息

您可以通过告警消息的类型、等级和状态来过滤关心的告警消息。消息等级是新建告警模板时在告警规则中设置的;消息状态是告警消息的处理状态。

消息状态

按告警问题的处理情况,告警消息分为如下四种状态:

  • 未处理:新产生的告警消息,还没有人处理相关问题。

  • 正在处理:触发告警后,已经有相关人员点击<处理>按钮处理问题但还未修复。

  • 已恢复:告警问题已经修复,系统会自动根据监控状态判断问题是否解决,即监控指标是否恢复正常,恢复正常后自动将告警消息的状态设置为已恢复,否则一直保持正在处理状态。

  • 规则失效:触发告警后,若因告警指标设置有误或不合适,在告警模板中重新修改了告警规则,则告警状态为规则失效。

查看快照

点击<查看>按钮查看告警消息反馈的问题详情,包括监控对象、告警内容、开始时间、结束时间以及对应指标在这段时间内的实际变化曲线与告警阈值的对比图,如下图所示。

7.4-2.png

在上图中可以看出,在2015年12月21日的18:23:10至18:23:46这段时间内,移动应用的响应时间始终大于设置的告警阈值100ms,因此触发告警。

处理告警

点击<处理>按钮开始领取任务并处理问题,此时告警状态显示为“正在处理”。系统会自动根据监控状态判断问题是否解决,即监控指标是否恢复正常,恢复正常后告警消息的状态显示为已恢复。

查看处理过程

点击监控事件查看告警消息处理的详情过程,包括监控对象、问题持续时长、告警等级、监测详情及告警消息发送详情,如下图所示。

7.5.png