测试alertmanager报警功能

先把对应的两个邮箱的stmp都打开

我们测试一下,把dubbo-service停了,这样consumer就会报错

把service的scale改成0

blackbox.od.com查看,已经failure了

prometheus.od.com.alerts查看,两个变红了(一开始是变黄)

这时候可以在163邮箱看到已发送的报警

QQ邮箱收到报警

完成(service的scale记得改回1)

关于rules.yml:报警不能错报也不能漏报,在实际应用中,我们需要不断的修改rules的规则,以来贴近我们公司的实际需求。

资源不足时,可关闭部分非必要资源

# 22机器,也可以用dashboard操作:
~]# kubectl scale deployment grafana --replicas=0 -n infra
# out : deployment.extensions/grafana scaled
~]# kubectl scale deployment alertmanager --replicas=0 -n infra
# out : deployment.extensions/alertmanager scaled
~]# kubectl scale deployment prometheus --replicas=0 -n infra
# out : deployment.extensions/prometheus scaled