1、如何自定义监控时间?
在“用户中心→账户设置→维护窗口”中创建维护窗口,您可以在维护窗口中自定义网站监控项目的监控时间,选择固定时间或按天、按周来执行监控并设置监控的起止时间和持续时间。
不同网站监控项目需要设置不同监控时间时,可以创建多个维护窗口,在每个维护窗口中选择不同的监控项目。
2、监测点分组有什么用?
监测点分组功能可以让您根据监控项目的需要,对监测点进行分组管理,不同的监控项目可以使用不同的监测点分组。
目前只有付费套餐包含监测点分组功能,如您是免费用户请升级套餐:
如果付费套餐到期,您创建的监测点分组将被暂停,使用分组功能的监控项目将会自动使用免费版所提供的监测点。
如果付费套餐降到免费版后再重新付费,需要在监测点设置中重新开启已暂停的分组,在此期间,使用此分组的监控项目将使用默认监测点分组。
3、监控频率越快越好吗?
当然越快越好。更快的监控频率,意味着您可以更加及时的发现故障,尽早的收到故障告警通知,从而快速采取相应措施,降低故障带来的损失。
同时,更快的监控频率还可以获得更加准确的可用率统计,不会遗漏时间较短的故障,为质量管理获得可靠的参考数据。
4、监控频率太快会给服务器带来额外负担吗?
完全不会。对于网页、Ping、DNS等网站监控类型,即便监控频率是1分钟,对于服务器处理能力的影响也是完全可以忽略的,所以您可以完全放心。
5、监控宝的访问是否会对网站造成负载压力?
不会的。以2分钟频率,20个监测点为条件,对页面访问量每天在5000次以下,不会影响网站性能。
6、监控宝的监测点分布在什么地方?
监控宝的分布式监测网络目前已拥有包括亚洲、北美洲、欧洲在内的上百个监测点,并且规模还在不断扩大,详细分布请参考监控宝官网的全球监测网络。
7、我可以发布一组网站监控项目的性能统计报告吗?
可以的,我们对此提供了很好的支持。您可以将多个网站监控项目加入一个分组,然后发布这个分组的可用率状态即可。
8、故障告警会不会不准确?
不会的。监控宝通过两项技术来保证故障告警的100%准确性:
监控宝采用分布式监测点技术
当所有监测点都无法访问您的网站或服务器时,监控宝才会认为这是故障,这也排除了由于个别监测点的网络原因而造成的误报。
您可以“报表中心→告警和故障”页面的“故障历史”中看到最近出现的故障记录。
这时候,你可能仍然会怀疑故障准确性,或者希望了解更多故障信息,您可以点击故障时间查看历史快照,可以看到在这个时间点所有监测点的状态。
故障重试告警机制
另一个保证告警准确率的技术是故障重试告警机制,您可以为网站监控项目设置“重试几次后告警”。假如您设置了重试1次,那么监控宝会在第一次发现故障后,以1分钟频率重试1次,如果仍然失败,才会生成告警消息,并发送告警通知。
在创建或修改网站监控项目时,您可以选择“重试几次后告警”,最多可设置重试3次。
9、监控宝发现网站无法访问,但在本地可以打开,是怎么回事呢?
监控宝的故障信息说明在当时所有监测点都无法访问您的网站,而在本地可以打开,出现这种情况的原因是多方面的,如:
您本地使用的网络环境和监测点的都不一样,监测点只代表当地的网络环境,如上海电信只代表上海的电信线路。
您打开网站的时间和监测点检查的时间不一致,如果网站不稳定,每次打开的结果可能都不一样。
您可以根据故障历史和历史快照分析故障发生时的详细情况。
10、我的网站打不开,但监控宝没有发现故障,是怎么回事?
很简单,监控宝是根据多个监测点的检查结果来判断是否故障的,您打不开网站并不代表网站有故障,可能是本地网络有问题。因为故障是指网站或服务器本身故障,而不包括个别网络线路的故障。
您可以在监控宝中检查是否有故障历史,如果没有,那就肯定不是故障,请您放心。
11、什么是响应时间稳定性?
在高级报告中,您会看到“响应时间稳定性报告”,那么稳定性是什么意思呢?我们来举一个例子:
监控一台服务器的ping响应时间,我们可以得到每小时的平均响应时间。假如,在今天凌晨5点到6点这个小时内,这台服务器的平均响应时间是30ms,紧接着,6~7点是32ms,7~8点是29ms,8~9点是36ms,9~10点是60ms。请注意,9点到10点这个小时的平均响应时间一下子慢了下来,几乎是正常值的2倍,这将影响到该服务器的响应时间稳定性,这种剧烈的波动意味着在9点到10点期间可能服务器所在网络质量较差。
所以,稳定性是用来衡量网站或服务器响应时间是否波动的一个指标,波动越大,用户体验越差,我们希望响应时间可以平稳。
稳定性最终体现在“稳定性分数”上。我们将一个星期中的波动情况收集后,通过数理统计方法计算出稳定性分数,它的范围从0到10,同时我们将分数分为3个级别:
非常稳定:9分-10分
稳定:6分-8分
不稳定:0分-5分
这样一来,在“响应时间稳定性报告”中,您可以看到各个稳定性级别中网站监控项目的统计。
12、网站监控项目的故障原因有哪些?
我们为您整理了网站监控项目的所有故障类型,同时附带故障原因的分析,供您参考。
监控类型 | 故障类型 | 故障原因分析 |
HTTP/HTTPs监控 | DNS无法解析 | 可能是域名DNS服务商或者监测点ISP服务商的DNS服务器故障,您可以在历史快照中找到用于解析的DNS服务器,并联系相关负责人。 |
无法连接服务器 | 可能是服务器服务中断,即没有提供正常的Web服务。建议您检查Web服务器软件是否工作正常,比如Apache/Lighttpd/Nginx/IIS/Tomcat等。 | |
请求超时 | 可能是服务器繁忙,建议您优化服务器性能或者进行扩容。 | |
服务器无返回数据 | 可能是服务器处理请求时出现异常,建议您检查服务器Web应用程序。 | |
网站无法访问 | 其它未知错误。 | |
响应内容超长 | 监控宝不支持超过1MB的响应内容,建议您使用HEAD方式。 | |
不包含匹配内容 | 当您使用匹配模式来检查响应内容时,会出现此类故障。 | |
Ping监控 | 数据包全部丢弃 | 即单次Ping丢包率为100%。 |
DNS监控 | 域名不存在 | 没有通过DNS服务器查询到您的域名,建议您联系域名服务商。 |
无解析记录 | 您没有给域名设置任何记录。 | |
FTP服务监控 | 无法连接 | 可能是服务器没有开启FTP程序,或者开启了防火墙。 |
无法验证身份 | 请您检查身份验证信息是否填写正确。 | |
TCP端口监控 | DNS无法解析 | 可能是域名DNS服务商或者监测点ISP服务商的DNS服务器故障,您可以在历史快照中找到用于解析的DNS服务器,并联系相关负责人。 |
无法连接服务器 | 可能是服务器该端口上的服务程序没有开启,或者开启了防火墙。 | |
连接请求被拒绝 | 可能是服务器繁忙,或者开启了防火墙。 | |
TCP连接超时 | 可能是服务器繁忙,或者开启了防火墙。 | |
UDP端口监控 | DNS无法解析 | 可能是域名DNS服务商或者监测点ISP服务商的DNS服务器故障,您可以在历史快照中找到用于解析的DNS服务器,并联系相关负责人。 |
服务器无响应数据 | 请您检查服务程序。 | |
不包含匹配内容 | 当您使用匹配模式来检查响应内容时,会出现此类故障。 | |
等待响应超时 | 可能是服务器繁忙,请您检查服务程序。 | |
SMTP服务监控 | DNS无法解析 | 可能是域名DNS服务商或者监测点ISP服务商的DNS服务器故障,您可以在历史快照中找到用于解析的DNS服务器,并联系相关负责人。 |
SMTP连接超时 | 可能是开启了防火墙。 | |
无法连接 | 可能是服务器没有开启SNMP服务。 |
13、监控宝支持虚拟主机吗?
监控宝支持各种部署形式的网站,包括虚拟主机、托管主机、租用主机、虚拟化主机(VPS)、云计算平台(Cloud Computing)等。
14、可以监控音频和视频能否打开吗?
可以的。音频和视频同样是基于HTTP的访问,您可以使用网址监控,填写音频或者视频的URL,并且在高级设置中,选择HEAD方式,这样便可以监控这些大文件是否可以访问。
除了音频和视频外,对其它流媒体的监控也是一样的。
15、监控宝的访问会影响PV/UV统计吗?
使用监控宝并不会影响访问量统计中的PV/UV等。
不论是Google Analytics还是CNZZ/51la等访问量统计系统,它们都是基于JS来统计访问量,而监控宝对网址的监控不会触发JS执行,所以不会计算到访问量中。
16、可以监控网页中是否包含特定内容吗?
可以的。创建监控项目时,您可以在高级设置中可以设置匹配响应内容和匹配响应方式来监控网页中的特定内容。
通过这种方式,您可以设置网页在包含或者不包含某些特定内容的时候进行告警,比如关键词、关键字、错误提示信息等。
这样一来您可以监控到以下一些情况的发生:
网站被DNS劫持,网站虽然能打开,但却成为了其它内容。监控宝并不能判断这些内容是不是您的网站内容,所以您可以使用匹配内容检查。
网站无法打开,但并不是标准HTTP错误(比如4xx/5xx),而是网站友好错误提示,监控宝并不能识别这些友好错误提示,所以您可以使用匹配内容检查。
需要注意的是,被监测的网页内容是包括了响应头信息的,所以您在填写特定内容时应尽量避免使用响应头信息中的内容,以免造成干扰。
17、监控宝可以监控的网址类型有哪些?
事实上,只要符合HTTP协议的网址都可以在监控宝中监控,为了便于您的理解,我们举例罗列出常见的网址类型:
首页域名:比如 http://www.domain.com。
二级域名:比如 http://img.domain.com。
更多页面网址:比如 http://www.domain.com/news/index.htm。
动态网页地址: 比如 http://www.domain.com/list.php 或 http://www.domain.com/list.js。
加密HTTPs的网址:比如 https://www.domain.com/login.aspx。
带端口的网址:比如 http://www.domain.com:8080/index.htm。
带IP地址的网址:比如 http://123.44.13.11/index.htm。
18、网站响应时间太慢时能进行告警吗?
可以的。网站响应时间太慢,也就是说网站虽然可以打开,但是速度比较慢(即响应时间变长),这时候您希望获得告警。
默认情况下,网站响应时间较慢时监控宝是不会主动为您告警的,但您可以在创建监控项目时添加自定义告警线,您可以对响应时间自定义告警条件,让监控宝在网站响应时间较慢时主动发送告警消息。
19、网站监控项目的平均响应时间是如何计算的?
网站监控项目的平均响应时间是通过每次检查中各个监测点响应时间计算出来的平均值。
20、 网站监控可以监控内网服务器吗?
可以的。您只需将您内网的服务器或服务通过NAT端口映射到一个外网IP和端口,就能对这个外网IP和端口进行TCP/UDP等监控,这样就可以监控到内网的服务器或服务了。
21、如何监控需要POST请求的页面?
对于一些需要POST表单提交的页面,使用HTTP监控也非常简单。在创建HTTP监控项目时,您只需在高级设置中选择使用POST请求方法,并填写提交的POST参数即可。
比如,您需要监控一个登录页面是否正常,这个页面内有需要表单提交的参数。例如:
您可以在网页的源码内查看需要提交的参数,也可以使用Firebug这样的工具查看此页面提交的POST参数,例如:
可以看到需要提交的参数有email、next、ticket三个参数,然后您可以将参数拼写成如下格式并填写到提交内容中:
email=test@test.com&next=&ticket=e10adc3949ba59abbe56e057f20f883e
监控宝在监测您的页面时会自动带上您设置的这些POST参数。如果您还需要对页面进行匹配响应内容检测以确认是否登录成功,可以设置匹配响应内容和匹配方式。
22、如何监控使用DNS负载均衡的网站?
使用DNS负载均衡的网站,有可能会将请求分发到多台不同IP的服务器,您可以直接创建HTTP监控项目来监控此域名,这样每次监控的请求也可能被分发到不同IP的服务器,您也可以在历史快照中看到请求最终发送到的服务器IP。
您还可以在创建HTTP监控项目时,在高级设置中指定服务器IP,有针对性的监控此域名下的某一台服务器。这样一来,所有的监控请求将跳过负载均衡策略,直接发送到这台服务器。
23、DNS无法解析怎么办?
为了得到最可靠的结果,我们在各个监测点使用当地ISP提供的DNS服务器。同时,为了给更多用户提供更好的体验,我们DNS查询时超时为1秒,重试1次。但是,如果DNS查询速度慢(比如域名提供商在国外),就可能出现DNS无法解析的错误。
对于普通网站监控,建议按以下方式处理:
调大DNS查询的TTL值
对于DNS服务器而言,都会有DNS缓存。但是如果当地并没有人解析过DNS,那么ISP提供的DNS服务器上并没有缓存。
更换DNS服务提供商
由于某些DNS服务器在国外,我们国内的监测点也会解析超时。或者某些DNS服务器在国内,我们国外的监测点也会解析超时。
24、无法连接服务器是什么原因?
无法连接服务器是指在与服务器建立TCP链接时超过5秒没有成功,产生的原因包括网络和服务器的处理能力。当网络连通性不好时,会出现这个问题;服务器处理能力不足时,对请求的响应时间过长也会导致这个问题。
如果这个问题不是频繁出现,只是偶尔发生,一般是网络波动的影响,可以通过设置更多的重试次数来消除掉。如果频繁发生,就需要有针对性的检查网络路由和服务器处理能力是否存在问题。
25、可以检测DNS劫持吗?
在一定程度上能够发现,对没有做过CDN的网站,创建DNS监控项目时,只要您选择的DNS查询查询类型是A记录,那么填写10个以内自己指定的IP地址。如果我们检测到DNS的IP地址都不是您填写的IP,将会认为这是一个故障并给您发送告警。
对做过CDN的网站,可以通过关键词做内容匹配,如果发现访问的页面里不包含预设的关键词,极有可能是域名被劫持了。
26、使用内网监控,如何保证我的数据安全?
我们采用采集器方式或私有云方式实现内网监控:
采集器方式:采集器的代码是公开的python脚本程序,不是编译后的可执行程序,逻辑很简单,只是收集性能指标数据,您可以做代码审查;采集器收集到的数据通过https以加密的方式发送给监控宝的数据中心;采集器主动向数据中心发送,数据中心不会访问采集器,不需要对采集器所在机器开放特殊端口。
私有云方式:所有的监控数据都存在客户的内网工作环境,不会发送给监控宝的数据中心。
27、监控项目所有监测点都有故障,为什么可用率还都是100%?
可用性的判断是规则是:一次监测中,您选择的所有监测点都不可用即故障,监控项目才是不可用的。
您所看到的监测点故障统计是所选时间范围内监测点各自的故障累计,但不一定是同时发生的,所以监控项目的可用率不受影响,还是100%。
28、可以做到只要有监测点不可用就发送告警吗?
可以的。在监控项目的自定义告警中,您可以设置任意几个监测点或指定几个监测点不可用时就发送告警。例如,选择任意几个监测点并输入1,这样只要有监测点不可用,监控宝就会发告警消息,如下图所示。
29、网站页面做过302跳转后能否监控到?
可以的。在创建监控项目时,您可以在告警设置中选择“支持301/302重定向”选项,这样就可以监控到跳转后的页面了。
30、网站响应时间很长,怎么找到问题原因?
您可以通过历史快照分析找出问题原因。首先需要在监控项目上针对响应时间设置自定义告警线,比如平均响应时间>1000ms,同时在创建项目时开启“记录节点故障快照”功能。
这样当告警线被触发后,系统会记录当时所有监测点的访问快照,您可以在快照中根据响应时间详情和分布分析问题所在。
31、为什么网站能打开,却出现请求超时故障告警?
有可能会出现这种情况的,因为我们在电脑上是通过浏览器来访问网站的,浏览器的重试次数比较多,所以有可能浏览器能够打开但监控宝还是会告警。
32、 能够监控我的广告页面是否正常,内容是否正确吗?
可以的。您可以在创建监控项目时,在高级设置中指定匹配内容来检查响应内容是否正确。
33、我能监控CDN的加速效果吗?
可以的。直接创建HTTP监控项目,监控宝的各个监测点访问的也是就近的CDN节点,和普通用户访问一样,这里各个监测点的可用率和响应时间能够看出各地CDN节点