创建报警
通过创建报警,您可以制定针对特定监控对象的报警规则。当规则被触发时,系统会以您指定的报警方式向报警联系人分组发送报警信息,以提醒您采取必要的问题解决措施。
前提条件
- 创建联系人:仅可将联系人分组设为报警的通知对象。
背景信息
默认报警条件:
- 为避免您在短时间内收到大量报警信息,系统 24 小时内对于持续的重复报警信息仅发送一条消息。
- 如果 5 分钟内没有重复报警,则会发送恢复邮件,通知数据恢复正常。
- 发送恢复邮件后,报警的状态会重置。如果该报警再次出现,会被视为新报警。
报警控件本质是数据集的数据展示方式,所以在创建报警控件的同时,会创建一个数据集来存储报警控件的底层数据。
创建报警
若需为应用监控任务创建一个 JVM-GC 次数同比报警,具体操作步骤如下:
通用基础字段含义
创建报警对话框的基础字段含义见下表。
字段 | 含义 | 说明 |
---|---|---|
应用站点 | 已创建的监控任务。 | 在下拉菜单中选择。 |
报警类型 | 报警指标的类型。 | 三种报警的报警指标类型各不相同:
|
报警维度 | 配置报警指标(数据集)的维度,可选择为:无、= 、遍历。 |
|
最近 N 分钟 | 报警判断最近 N 分钟内数据结果是否达到触发条件。 | N 的范围为:3~3600 分钟。 |
通知方式 | 支持邮件、短信和钉钉机器人三种方式。 | 可勾选多种方式。若需设置钉钉机器人报警请参见设置钉钉机器人报警。 |
报警静默期开关 | 可选择为开启或关闭,默认为开启状态。 |
|
报警级别 | 包括警告、错误和致命。 | - |
通知时间 | 报警发送时的通知时间。此时间范围外将不发送报警通知,但仍会有报警事件记录。 | 查看报警事件记录请参见管理报警 。 |
通知内容 | 自定义的报警通知内容。 | 您可以编辑默认模板。在模板中,除 $报警名称、$筛选、 $报警时间和 $报警内容等 4 个变量(暂不支持其它变量)为固定搭配,其余内容均可自定义。 |
通用复杂字段含义:环比与同比
- 环比上升 / 下降 % :若 β 为最近 N 分钟的数据(可选择为平均值、总和、最大值和最小值),α 为前 2N 分钟到前 N 分钟的数据, 环比为 β 与 α 做比较。
- 与上小时同比上升 / 下降 %:若 β 为最近 N 分钟的数据(可选择为平均值、总和、最大值和最小值),α 为上小时最近 N 分钟的数据,与上小时同比为 β 与 α 做比较。
- 与昨日同比上升 / 下降 %:若 β 为最近 N 分钟的数据(可选择为平均值、总和、最大值和最小值),α 为昨日同一时刻最近 N 分钟的数据,与昨日同比为 β 与 α 做比较。
通用复杂字段含义:报警数据修订策略
报警数据修订策略可选择为补零、补一或补零 Null(默认)。此功能一般用于无数据、复合指标和环比同比等异常的数据修复。
- 补零: 将被判断的数值修复为 0。
- 补一: 将被判断的数值修复为 1。
- 补零 Null: 不会触发报警。
应用场景:
- 异常情况一:无数据
用户 A 想利用报警功能监控页面访问量。创建报警时,选择前端监控报警,设置报警规则为 N = 5 时页面访问量的总和小于等于 10 则报警。若该页面一直没有被访问,则没有数据上报,不会发送报警。为解决此类问题,可将报警数据修订策略勾选为补零,将没有收到数据视为收到零条数据,符合报警规则,即可发送报警。
- 异常情况二:复合指标异常
用户 B 想利用报警功能监控商品的实时单价。创建报警时,选择自定义监控报警,设置变量 a 的数据集为当前总价,变量 b 的数据集为当前商品总数,报警规则为 N = 3 时 (当前总价)/(当前商品总数)的最小值小于等于 10 则报警。若当前商品总数为 0 时,复合指标(当前总价)/(当前商品总数)的值不存在,则不会发送报警。为解决此类问题,可将报警数据修订策略勾选为补零,将复合指标(当前总价)/(当前商品总数)的值视为 0,符合报警规则,即可发送报警。
- 异常情况三:指标环比、同比异常
用户 C 想利用报警功能监控节点机用户使用 CPU 百分比。创建报警时,选择应用监控,设置报警规则为 N = 3 时节点机用户使用 CPU 百分比的平均值环比下降 100% 则报警。若最近 N 分钟用户的 CPU 故障无法工作,即 α 无法获取,导致环比结果不存在,则不会发送报警。为解决此类问题,可将报警数据修订策略勾选为补一,将环比结果视为下降 100%,符合报警规则,即可发送报警。
后续步骤
您可以在管理报警系统中查询和删除报警记录。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
评论