API监控包括可用性、正确性、响应时间、可用率、故障率、正确率、平均可用率、平均正确率、平均响应时间、错误总时长、错误总次数、故障总时长、故障总次数13个监控指标。判断和计算规则如下:

指标

规则

可用性

请求

单监测点:一次监测,返回状态码为1XX、2XX或3XX则为可用,否则为故障。

多监测点:一次监测,所有监测点都可用,则为全部可用;部分监测点可用,则为部分可用;所有监测点都不可用,则为故障。

事务

单监测点:一次监测,事务的所有请求都可用才为可用,否则为故障。

多监测点:一次监测,所有监测点都可用,则为全部可用;部分监测点可用,则为部分可用;所有监测点都不可用,则为故障。

正确性

请求

单监测点:一次监测,断言正确则为正确,否则为错误。

多监测点:一次监测,所有监测点的断言都正确,则为全部正确;部分监测点的断言正确,则为部分正确;所有监测点的断言都不正确,则为错误。

事务

单监测点:一次监测,事务的所有请求都正确才为正确,否则为错误。

多监测点:一次监测,所有监测点都正确,则为全部正确;部分监测点正确,则为部分正确;所有监测点的请都不正确,则为错误。

响应时间

请求:一次监测,请求结果返回的时间,包括DNS解析、建立连接、服务器计算、内容下载。(不可用、不正确的不计算)

事务:一次监测,事务中所有请求的响应时间总和。(不可用、不正确的不计算)

可用率

请求:在单个监测点,请求可用率=请求可用次数/请求总次数

事务:在单个监测点,事务可用率=事务可用次数/事务总次数

故障率

请求:单个监测点,请求故障率=1-请求可用率

事务:单个监测点,事务故障率=1-事务可用率

正确率

请求:在单个监测点,请求正确率=请求正确次数/请求总次数

事务:在单个监测点,事务正确率=事务正确次数/事务总次数

平均可用率

请求:多个监测点,先计算每个监测点的请求可用率,然后取所有监测点请求可用率的平均值。

事务:多个监测点,先计算每个监测点的事务可用率,然后取所有监测点事务可用率的平均值。

平均正确率

请求:多个监测点,先计算每个监测点的请求正确率,然后取所有监测点请求正确率的平均值。

事务:多个监测点,先计算每个监测点的事务正确率,然后取所有监测点事务正确率的平均值。

平均响应时间

请求

单监测点:一段时间内,某监测点、某请求响应时间的平均值。(不可用的不计算)

多监测点:先计算每个监测点的请求响应时间的平均值,然后取所有监测点的平均值。(不可用不计算)

事务

单监测点:一段时间内,某监测点、某事务响应时间的平均值。(不可用的不计算)

多监测点:先计算每个监测点的事务响应时间的平均值,然后取所有监测点的平均值。(不可用不计算)

错误总时长

单监测点:指定时间内,某监测点的错误总时长。

多监测点:指定时间内,所有监测点错误总时长之和。

错误总次数

单监测点:指定时间内,某监测点的错误总次数。

多监测点:指定时间内,所有监测点错误总次数之和。

故障总时长

单监测点:指定时间内,某监测点的故障总时长。

多监测点:指定时间内,所有监测点故障总时长之和。

故障总次数

单监测点:指定时间内,某监测点的故障总次数。

多监测点:指定时间内,所有监测点故障总次数之和。