我如何处理 INSUFFICIENT_DATA 状态的 Amazon CloudWatch 警报?

1 分钟阅读
0

我想处理 INSUFFICIENT_DATA 状态的 Amazon CloudWatch 警报。

简述

当您创建 CloudWatch 警报时,它的第一个状态是 INSUFFICIENT_DATA。在对受监控指标进行的第一次评估完成之前,它会一直处于此状态。通常,警报会在创建之后几分钟内退出 INSUFFICIENT_DATA 状态。这是指标的正常行为。

以下是您的 CloudWatch 警报一直处于 INSUFFICIENT_DATA 状态的可能原因:

  • 指标缺少数据点。
  • 指标参数配置错误。
  • 警报周期配置错误。
  • 由于缺乏连接数据点交付延迟

解决方法

要处理处于 INSUFFICIENT_DATA 状态的 CloudWatch 警报,请检查以下可能的原因:

指标缺少数据点

当您有监控基础结构改变、网络故障和服务中断等事件的指标时,该指标不会定期报告数据点。如果警报在指定时间段内没有指标数据点,数据点将缺失,警报状态为 INSUFFICIENT_DATA

要解决因缺少数据点而导致的 INSUFFICIENT_DATA 状态,请确保配置警报如何处理缺少的数据点。使用 notBreaching 参数按照正常且在阈值内处理缺少的数据点,或使用 ignore 参数保持当前警报状态。有关更多信息,请参阅配置 CloudWatch 警报如何处理缺少的数据

指标参数配置错误

每个指标由命名空间、指标名称和维度(最多 30 个)定义。检索数据点时,必须指定时间戳和单位(可选)。如果您为其中一个参数提供的值不正确,CloudWatch 会尝试检索不存在的指标。这会导致数据集为空。

**注意:**通常是使用一个单位将数据点推送到指标。创建警报时您不需要指定单位。同时,如果您不指定单位,也不会遇到配置问题。当您的指标数据点有多个单位时,最佳做法是使用正确的单位。

要解决由错误配置的参数导致的 INSUFFICIENT_DATA 状态,请完成以下步骤:

  1. 运行 DescribeAlarms API 命令获取受监控指标的完整参数列表。
  2. 运行 ListMetrics API 命令。将 ListMetrics 输出与受监控指标的参数列表进行比较。
  3. 检查指标参数中是否存在拼写错误、小写和大写字母使用不当以及是否有尺寸不正确或缺少的问题。

警报周期配置错误

可以将警报配置为按您需要的频率检索数据点。但是,如果您使用的时间比服务或源所用时间短,您可能会收到意外的警报状态。要解决此问题,将您的警报周期配置为大于或等于推送指标数据点的期间。此外,您可以将闹钟设置为使用 M/N 设置。有关更多信息,请参阅评估警报

由于缺乏连接数据点交付延迟

如果您有标准警报设置,警报会每分钟评估一次您的指标。评估指标时,警报会从配置的指标检索可用数据点。如果警报评估指标时没有连接,警报将无法检索数据点或将其传送到 CloudWatch。这会调用 INSUFFICIENT_DATA 状态。

恢复连接后,带有时间戳的数据点积压将被发送到 CloudWatch。在延迟之后发送数据点时,警报会根据指定的期间和评估周期检索最近的数据点。同时,指标中的空格不再为空,数据点存储在 CloudWatch 中。但是,警报已经评估了这一时间范围,警报历史记录仍会显示 INSUFFICIENT_DATA 状态和类似于下方的错误消息:

"stateValue": "INSUFFICIENT_DATA",
   "stateReason": "Insufficient Data: 2 datapoints were unknown."

要解决因数据点延迟传送而导致的 INSUFFICIENT_DATA 状态,配置 CloudWatch 警报如何处理缺少的数据

AWS 官方
AWS 官方已更新 6 个月前