Skip to content

主机监控

特别注意

本章节所有Api传递参数中的通知组必须与系统设置-->待机与通知组-->通知组管理中已有的通知组保持一致。

主机监控管理

本机网络连通性

指定一个IP地址,监测报警灯根据与该IP地址的连通性,判断自身是否离线,当报警灯离线时会进行声光告警。

当报警灯无法Ping通该IP地址时,其余的所有监控均暂停工作,报警灯只会播报自身网络离线

参数

  1. IP地址:需要被检测的目标IP地址
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 检查间隔:轮询检测间隔
  4. 延迟阈值:延迟 ≤ 阈值
  5. 丢包率阈值:丢包率 ≤ 阈值

注意:当延迟、丢包率大于设定阈值时将发生告警

配置案例

主机信息配置

参数

  1. 主机地址:需要被检测的目标IP地址或域名
  2. 主机名:目标IP地址或域名的主机名
  3. SNMP凭证(可选)

SNMP凭证配置

注意

若要使用SNMP Get功能,需要开启SNMP凭证,并正确配置

  • 版本协议:v1

  • 版本协议:v2c

  • 版本协议:v3

配置案例

  1. 百度
  2. 服务器

主机监控配置

网络连通性监控

该页面用来配置检测主机网络连通性,即Ping。当该主机无法Ping通时,该主机其下的所有监控项均会暂停播报,而只会播报该主机掉线故障

参数

  1. 延迟阈值:延迟 ≤ 阈值
  2. 丢包阈值:丢包率 ≤ 阈值
  3. 监测间隔:轮询检测间隔
  4. 告警阈值:监测失败次数 ≤ 阈值
  5. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  6. 抖动监测(可选):该功能主要检测服务是否处于一个不稳定的状态,例如频繁的联通、断线,但不会触发告警的情况。
    • 连续监控:轮询阈值
    • 状态变化:监测失败阈值

注意:当延迟、丢包率、告警大于设定阈值时将发生告警

配置案例

  1. 参数配置
  2. 测试结果

主机监控项

该页面用来配置主机的其他监控项,支持的监控项见下方监控项类型章节。

监控项类型

网页监控

互联网的应用越来越广泛,网络应用对网络可用性和网络性能的要求也越来越高,因此对网络可用性和网络性能的监测也越来越重要。

所谓网络可用性是指端到端全网所能提供的无故障服务时间与全部运行时间之比。

网络管理目标有时就是关注网络的可用性,即使网络的可用性尽可能地接近100%,任何关键的网络设备的停机都将影响到可用性。

针对小微型网络环境,报警灯提供了轻量级的HTTP协议监控,可以为Web服务、网站提供可靠性监控。

可避免的问题

  1. DNS解析出错
  2. 域名过期
  3. 云服务宕机
  4. 网站被攻击导致页面篡改
  5. 网络链路问题

功能具备特点

  1. 当网站因为网络故障或内部错误导致无法访问时,报警灯可以及时进行声光播报,提醒用户及时处理。
  2. 支持关键词探测,当网站遭到非法篡改时,报警灯可以通过语音提示播报问题。
  3. 支持HTTP Basic登录,当账户信息被篡改时进行告警
  4. 支持HTTPS

参数

  1. 监控名称:监测主机监控项名称
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 监测间隔:轮询检测间隔
  4. 告警阈值:监测失败次数 ≤ 阈值
  5. 连续监控:轮询阈值
  6. 状态变化:监测失败阈值
  7. 协议:支持http、https
  8. 端口:用于监控的端口(切换协议时,端口会自动切换成对应协议的默认端口)
  9. 监测路径:监测path
  10. 关键字监测类型:当检测的字符串在非标准英文及符号时(例如汉字),网页编码必须为UTF-8
    • 字符串形式:当输入的字符串在网页中不存在是,则认为检测失败,触发报警
    • 正则形式:当网页中的内容不满足正则表达式时,则认为检测失败,触发报警
  11. 关键字监测内容:根据关键字监测类型进行对网页内容与字符串进行比较
  12. 登录信息:对于使用HTTP基本鉴权时,即访问网站会出现要求登陆的对话框

注意

参数:监控间隔为5,告警阈值为2,连续监控为10,状态变化为4
解释:5分钟监控一次,当连续10次监控中连续2次出现问题则认为是告警;当连续10次监控中监测结果出现4次状态变化,则认为是抖动;

配置案例

  1. 参数配置
  2. 测试结果

注意:拓展配置默认不启用,如需请手动开启并配置参数

FTP监控

报警灯可以提供FTP、SFTP监控功能,对FTP、SFTP(SSH File Transfer Protocol)服务的可用性进行监视,发现故障立即告警。

同时,由于SFTP本质也是通过SSH实现,所以通过SFTP功能可以间接实现对SSH可用性的监控。

参数

  1. 监控名称:监测主机监控项名称
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 监测间隔:轮询检测间隔
  4. 告警阈值:监测失败次数 ≤ 阈值
  5. 连续监控:轮询阈值
  6. 状态变化:监测失败阈值
  7. 协议:支持http、https
  8. 端口:用于监控的端口(切换协议时,端口会自动切换成对应协议的默认端口)
  9. 用户名:FTP登录用户名,匿名登录时无需填写
  10. 密码:FTP的登录密码,匿名登录时无需填写。密码不能包含特殊符号,只允许英文字符以及数字

配置案例

TCP端口监控

目前很多小微型网络环境,在注重性能监控的时候,忽略了TCP端口的监控。其实TCP连接真实的反应了服务器和服务本身的队列情况,是最灵敏的服务阴晴表。

现在的服务之间都是通过网络进行通信,而很多服务通信是基于TCP的方式,包括大家熟悉的HTTP、FTP等。 在工作中,服务启动后监听指定端口,然后按照特定的7层协议通过此端口接收处理任务,4层使用TCP 通信传输。

另外从整体上看,tcp状态也是服务器健康状态的一个反应,当受到某些网络攻击时,tcp连接也能第一时间反应出来, 比如说syn攻击,当服务器上有大量SYN-RECEIVED半连接状态时,十有八九是有问题了。当存在这种问题是,往往导致新的TCP连接无法建立,从而影响服务。

报警灯支持TCP协议的端口监控,可以为使用TCP端口的服务、应用提供可靠性监控。当服务或应用异常,端口关闭时,报警灯可以及时进行声光播报,提醒用户及时处理。

参数

  1. 监控名称:监测主机监控项名称
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 监测间隔:轮询检测间隔
  4. 告警阈值:监测失败次数 ≤ 阈值
  5. 连续监控:轮询阈值
  6. 状态变化:监测失败阈值
  7. 端口:用于监控的端口

配置案例

  1. 参数配置
  2. 测试结果

SNMP Get

SNMP Get是简单网络管理协议中的一种主动获取网络设备状态信息的工具。

目前绝大多数网络设备以及监控平台都支持该功能,报警灯通过SNMP Get协议主动轮询网络设备或监控平台的运行状况,当设备出现问题,警灯立即报警。

说明书提供了一个Windows、Linux通过SNMP Get监控CPU使用率、内存、硬盘使用率的案例可供参考。点击跳转

提示

本功能需要具备一定的运维知识以及对SNMP有一定的了解。

本功能不依赖mib文件,而使用原始的OID进行数据获取,OID的获取请参考被监控设备文档或联系被监控的设备厂家获取。

一般来说根据Mib文件可以得到对应的OID,如果您不了解该知识,请自行搜索MIB文件与OID的转换相关文章。

参数

  1. 监控名称:监测主机监控项名称
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 监测间隔:轮询检测间隔
  4. 告警阈值:监测失败次数 ≤ 阈值
  5. 连续监控:轮询阈值
  6. 状态变化:监测失败阈值
  7. OID:要监控的SNMP OID,可以以.1开头,也可以以1开头,请输入纯数字形式的OID
  8. 值类型:分为数值、字符串、比特类型
  9. 期望值:
    • 字符串:可输入正则,输出不包含期望值时,则报警
    • 数值型:输入两个数值,通过引号确定范围,输入案例如下:
      1. 输入 10:表示小于0 或 大于10时告警,意味着正常值范围在0≤x小于等于10
      2. 输入 10::表示小于10告警,意味着正常值范围为10≤x
      3. 输入 ~:10:表示大于10告警,意味着正常值正常值范围为x≤10
      4. 输入10:20:表示小于10或大于20时告警 ,意味着正常值范围10≤x≤20
      5. 输入@10:20:表示 大于等于10或小于等于20时告警,意味着正常值范围x≤10或20≤x
    • 比特类型:输入一个十进制数。获取到的值与期望值做异或运算,如果结果不为0,则报警

配置案例

  1. 参数配置
  2. 测试结果

注意:若未配置 SNMP 凭证,则需要配置后方可监控 SNMP Get类型

确定:将跳转编辑主机页面

取消:将跳转主机监控配置页面

SNMP Trap

SNMP Trap 是简单网络管理协议中的一种主动发送通知信息的工具。

目前绝大多数网络设备以及监控平台都支持该功能,当网络设备或监控平台发生问题,可以通过SNMP Trap将错误信息发送出去。 报警灯可以捕获到该消息,并按照定义好的规则进行报警。

参数

  1. 监控名称:监测主机监控项名称
  2. 通知分组:若不进行更改为默认通知组,否则请添加通知组后进行选择
  3. 播报内容:表示当满足报警规则时,语音合成朗读的内容(是否支持语音播报因机器而异),并且对应Trap记录中附加消息项
  4. Trap OID:表示需要监听的Trap的OID
  5. 变量绑定方式:
    • 与(and)
    • 或(or)

注意:收到相关OID的Trap后还会判断Trap中是否包含该列指定的OID,并且值是否与变量值相符合

配置案例

  1. 参数配置
  2. 测试命令 snmptrap -v 2c -c public 192.168.0.66 '' 1.2.3.3.2.1 1.2.3.3.2.1.0 s "Warning"

SNMP Trap 联动邮件通知测试案例

测试命令: snmptrap -v 2c -c public 192.168.0.66 '' 1.2.3.3.2.1 1.2.3.3.2.1.0 s "Warning"

测试结果: