zabbix告警抑制
zabbix 告警抑制
本人认为告警抑制有两种方法:
一种是触发器的依赖关系,一种是调整触发器触发动作的时间。
第一种告警抑制
举例:
路由器A----->路由器B------>路由器c
我们在监控网络设备的时候,三台设备上都对网口进行了监控监控,如果路由器A,的网络不通了,那么后边的 路由器B 和 路由器C 的网络肯定也就不通了,那么这时候三台路由器都会报警,没有办法确定谁得问题,但是我们添加触发器依赖关系,
触发器的依赖是这样的,A 依赖 B ,那么当B 发生告警之后,A 就不会再次告警,
由此可见 路由器c 要依赖 B 和 A , 路由器B要依赖A,
对于路由器c来说,当B或A 发生告警了之后,c就不会在告警了,同样,相对于B来说,A发生了告警,B就不会在告警了,就是同意问题出现,只有一台机器告警,
这种可以进行告警抑制
第二种告警抑制:
通过修改触发器发现问题之后,提示问题的时间,
我们在配置告警的时候,大部分都是发现问题只有就 "immediately(立刻)"报警,但是这种情况有不确定性,
举例:
我们监控端口的状态,当端口检测不到之后就告警,但是当网络抖动的时候,也会检测不到端口的存在,这种情况是不可避免的,这种情况如果我们设置"immediately(立即)" 告警的话是不合适的
所以我们就设置步骤:动作里有步骤的定义,如下:
我们在定义监控项的时候,他的更新时间是每1分钟更新一次,
在动作-->操作 里边是讲步骤的(step),步骤1,就是立即发送,我们之前说过了端口监控不适合,
默认操作步骤持续时间:就是步骤一到步骤二之间经过60s,也可以自己设定,
我们下边把步骤设置为了4,就说明我们在三分钟(因为步骤1是立即发送)以后发送告警,三分钟可以扫描5038端口3次,如果都是检测不到的话,就会发送告警,这样比较有说服力,
达到的效果就是,在发第一次发现端口异常后的三分钟后,并且每次检测都是端口异常,才会发送告警。