Prometheus黑盒监控
Prometheus黑盒监控
Hunter什么是白盒、黑盒?
- 白盒监控:程序内部的一些指标,这类监控专注的点是原因,也就是一般为出现问题的根本,此类监控称为白盒监控,主要关注的是原因
- 黑盒监控:监控关注的是现象,也就是正在发生的告警,比如某个网站突然慢了,或者是打不开了。此类告警是站在用户的角度看到的东西,比较关注现象,表示正在发生的问题,这类监控称为黑盒监控。
在黑盒监控,Prometheus社区提供了官方的黑盒监控解决方案Blackbox Exporter
,其允许用户通过:HTTP、HTTPS、DNS、TCP以及ICMP的方式对网络进行探测。
Blackbox Exporter下载地址:
- https://prometheus.io/download/
- https://git.xfj0.cn/https://github.com/prometheus/blackbox_exporter/releases/download/v0.24.0/blackbox_exporter-0.24.0.linux-amd64.tar.gz(加速地址)
部署Blackbox Exporter··
1、下载blackbox_exporter
1 | # wget https://git.xfj0.cn/https://github.com/prometheus/blackbox_exporter/releases/download/v0.24.0/blackbox_exporter-0.24.0.linux-amd64.tar.gz |
2、添加到启动项
1 | # vim /usr/lib/systemd/system/blackbox_exporter.service |
3、启动加入开机自启,并检查是否正常启动
1 | # systemctl restart blackbox_exporter |
icmp监控
什么是ICMP?
互联网控制消息协议 (ICMP) 是一组通信规则,设备使用这些规则在网络中传达数据传输错误。在发送方和接收方之间的消息交换中,可能会出现某些意外错误。例如,消息可能太长,或者数据包可能无法按顺序到达,因此接收方无法汇编。在这种情况下,接收方使用 ICMP 向发送方发送错误消息并请求重新发送消息。
通过icmp 这个指标的采集,我们可以确认到对方的线路是否有问题。这个也是监控里面比较重要的一个环节。我们要了解全国各地到我们机房的线路有哪条有问题我们总结了两种方案:
- 全国各地各节点ping 和访问数据采集。这种类似听云运营商有提供这类服务,但是要花钱;
- 我现在用的方法就是:找各地测试ping 的节点,我们从机房主动ping 看是否到哪个线路有故障,下面我们开始。
1、修改prometheus配置文件,添加相关监控项
1 | # vim prometheus.yml |
2、添加配置文件
1 | # pwd |
3、重启服务
1 | # systemctl restart prometheus |
到prometheus的web界面查看
http相关指标监控
1、修改prometheus配置文件,添加相关监控项
1 | scrape_configs: |
2、添加配置文件
1 | # pwd |
3、重启服务
到prometheus的web界面查看
Granfana配置
找到仪表盘,导入9965模板
评论
匿名评论隐私政策
✅ 你无需删除空行,直接评论以获取最佳展示效果