1、如何为插件关联监控项目?

采集器和插件只是负责监控项目的数据采集工作,需要匹配相应的监控项目才能完成整个监控。目前平台支持以下两种方式来完成他们直接的关联:

  • 创建服务器或是服务监控项目时,在页面选择“使用采集器获取数据”,利用已有的采集器和插件完成项目数据的采集

  • 在采集器列表中选择一个采集器,在其下面所控制的插件上面直接创建监控项目。

详细说明请参考“创建关联项目”。

2、采集器运行时出错怎么办?

采集器的运行日志会按天自动生成在log目录下,可以通过log分析采集器的运行情况。

插件运行连续多次出错时会被设为停止状态,此时应通过日志分析插件的出错原因,也可以直接联系我们。

3、采集器能正常运行,但获取不到数据?

查看config下的jkbConfig.py文件,检查里面的jkbKey值是否和您创建的任务key一致。任务的key值可以在采集器实例列表中找到,两key值应保持一致。

4、Python版本不符合怎么办?

若当前Python版本不符合,运行start.sh/start.bat时,采集器启动失败,可以在log目录下的日志里查看出错信息。

5、服务器性能监控获取不到数据怎么办?

我们的采集器需要通过snmpwalk命令去获得被监测机器的数据,所以请确认安装了必要的工具。

1、请确认安装采集器的服务器装上了net-snmp及MIBS库。

  • Ubuntu/Debian需要安装snmp和snmp-mibs-downloader包:

apt-get install snmp snmp-mibs-downloader

      并清空/etc/snmp/snmp.conf文件:

#>/etc/snmp/snmp.conf
  • Centos/RHEL需要安装net-snmp-utils包。

  • Windows机器需要安装snmpwalk.exe,请下载安装并重启采集器所在的机器。

http://jaist.dl.sourceforge.net/project/net-snmp/net-snmp%20binaries/5.6.1.1-binaries/net-snmp-5.6.1.1-1.x86.exe

如果以上链接失效,请到官方网站下载对应版本的exe文件:

http://www.net-snmp.org/download.html

2、请确认被监控服务器安装上了net-snmp。

3、测试是否成功:

  • 如果您在SNMP中采用的是v2c验证方式,并且community字符串假设为“public”,那么测试方法为:

snmpwalk -v 2c -c public your_ip_here:161 sysDescr #your_ip_here 为被监控的服务器IP,您使用的是采集器,通常您会在此处填写内网IP。
  • 如果您在SNMP中采用的v3验证方式,用户名为“user”,密码为“pass”,加密方式为“MD5”,那么测试方法为:

snmpwalk -v 3 -l authNoPriv -a MD5 -u user -A pass your_ip_here:161 sysDescr

在命令行输入这些语句后,如果服务器SNMP正常开启的话,您应该可以获得以下类似的反馈:

SNMPv2-MIB::sysDescr.0 = STRING: Linux host1 2.6.27.19-5-default #1 SMP 2009-02-28 04:40:21 +0100 x86_64

如果测试中无法获得类似的正确反馈,则说明SNMP安装或者设置存在问题,您可以参考随后的错误信息分析。

在本机测试中,如果您需要更详细的信息,在前面的snmpwalk测试命令中可以加上-d选项,打开debug信息,这样您可以看到收发的数据包。

6、错误信息分析

错误1:Timeout: No Response from X.X.X.X

通常使用SNMP协议版本v2c时会遇到这类错误,可能的原因有:

  • community字符串填写错误:请仔细核对-c参数后的值,比如是不是1和l、0和O写混了,大小写拼错了等。

  • IP地址访问不到:您可以使用ping、traceroute/tracert命令测试该IP。

  • 端口访问不到:您可以使用netstat命令查看该端口是否正常监听;Linux下使用ps命令查看snmpd进程是否运行;在Windows下查看服务是否开启。

  • 防火墙没有开放该端口:尝试关掉防火墙试试,如果关掉防火墙能成功,则说明是防火墙的问题,具体防火墙配置的方法请查询防火墙相关资料。

备注:

Linux下查看snmpd进程是否运行,可以通过以下命令:

$ ps afx | grep snmpd$
4889 ? S 42:44 /usr/local/snmp/sbin/snmpd

Windows下查看SNMP服务是否运行,可以在“运行”菜单中输入“services.msc”,找到“SNMP Service”,应该是“启动”的状态。

错误2:snmpwalk: Timeout (Sub-id not found: (top) -> sysDescr)

通常使用SNMP协议版本v3时会遇到这类错误,可能的原因有:

  • IP地址访问不到:您可以使用ping、traceroute/tracert命令测试该IP。

  • 端口访问不到:您可以netstat命令查看该端口是否正常监听;Linux下使用ps命令查看snmpd进程是否允许;在Windows下查看服务是否开启。

  • 防火墙没有开放该端口:尝试关掉防火墙试试,如果关掉防火墙能成功,则说明是防火墙的问题,具体防火墙配置的方法请查询防火墙相关资料。

错误3:snmpwalk: Authentication failure (incorrect password, community or key) (Sub-id not found: (top) -> sysDescr)

通常使用SNMP协议版本v3时会遇到这类错误,可能的原因有:

  • 密码填写错误

  • 加密方法 (MD5/SHA) 填写错误

错误4:snmpwalk: Unknown user name (Sub-id not found: (top) -> sysDescr)

通常使用SNMP协议版本v3时会遇到这类错误,可能的原因是用户名填写错误。