使用AWS re:Post即您表示您同意 AWS re:Post 使用条款

如何在 CloudWatch 中了解我的警报并评估我的警报过渡状态?

2 分钟阅读
0

我想在 Amazon CloudWatch 中了解我的警报并评估我的警报过渡状态。

简短描述

当您创建警报时,CloudWatch 警报会根据提供的指标数据评估指定的条件。请注意创建警报时使用的以下属性:

  • Metric selection(指标选择)- 要监控的指标。
  • Threshold configuration(阈值配置)-调用警报的特定值。
  • Evaluation period(评估期限)-警报期限的数量。使用此参数可避免虚假警报。
  • DatapointsToAlarm- 调用警报时必须超出的数据点数量。使用它来设置警报灵敏度。
  • Period(周期)- 指标数据聚合的时间间隔(例如,每 60 秒)。
  • Statistic(统计数据)- 指标数据聚合的类型(例如,MINAVG)。
  • Treat Missing Data (TMD)(处理缺失数据 (TMD))- 用于在指标数据丢失时评估警报的方法。

要了解 CloudWatch 如何评估警报然后处理缺失的数据,请参阅评估警报配置 CloudWatch 警报对缺失数据的处理方式

解决方法

要查看 CloudWatch 如何分析检索到的数据点,请在 CloudWatch 中查看您的 Alarm History(警报历史记录):

  1. 打开 CloudWatch 控制台,然后在导航窗格中选择 Alarms(警报)。
  2. 选择您的警报,然后选择 History(历史记录)选项卡。在 History(历史记录)选项卡的 Date(日期)列中,超链接的时间戳条目显示警报何时进入 ALARM 状态。

要评估 Alarm History(警报历史记录)中的警报过渡状态,请参阅警报 1 和警报 2 的以下 JSON 示例。对于这两个警报 JSON 示例,请查看以下条件:

  • Metric(指标)- HealthyHostCount
  • Threshold configuration(阈值配置)- 1(三分钟内不超过 1 个数据点)
  • Evaluation period(评估期限)-3 个数据点
  • Period(周期)- 1 分钟
  • Statistic(统计数据)-最小值
  • Treat missing data (TMD)(处理缺失数据 (TMD))- 例如警报 1,treat missing data(处理缺失数据)选项为 missing(缺失)。例如警报 2,treat missing data(处理缺失数据)选项为 breaching(超出阈值)。

警报 1 JSON 示例:

"newState": {
      "stateValue": "ALARM",
      "stateReason": "Threshold Crossed: 1 out of the last 3 datapoints [1.0 (28/03/24 17:11:00)] was less than or equal to the threshold (1.0) (minimum 1 datapoint for OK -> ALARM transition).",
      "stateReasonData": {
        "version": "1.0",
        "queryDate": "2024-03-28T17:13:09.156+0000",
        "startDate": "2024-03-28T17:09:00.000+0000",
        "statistic": "Minimum",
        "period": 60,
        "recentDatapoints": [
          2,
          2,
          1
        ],
        "threshold": 1,
        "evaluatedDatapoints": [
          {
            "timestamp": "2024-03-28T17:11:00.000+0000",
            "sampleCount": 2,
            "value": 1
          }

对于前面的 JSON,检索了三个数据点,其值分别为 221。警报过渡到 ALARM 状态,因为最后 3 个数据点中的 1 个小于或等于阈值 1。

**注意:**evaluatedDatapoints 参数显示了有关超出阈值数据点的详细信息。对于前面的 JSON,CloudWatch 收到了 2 个样本。当这些样本按 Minimum(最小值)统计数据聚合时,返回的数据点为 1。该值超过了 less than or equal to 1(小于或等于 1)的阈值。结果,警报过渡到 ALARM 状态。

警报 2 JSON 示例:

"newState": {
      "stateValue": "ALARM",
      "stateReason": "Threshold Crossed: 2 datapoints were received for 3 periods and 1 missing datapoint was treated as [Breaching].",
      "stateReasonData": {
        "version": "1.0",
        "queryDate": "2024-03-28T20:09:52.566+0000",
        "startDate": "2024-03-28T20:00:00.000+0000",
        "statistic": "Minimum",
        "period": 60,
        "recentDatapoints": [
          2,
          2
        ],
        "threshold": 1,
        "evaluatedDatapoints": [
          {
            "timestamp": "2024-03-28T20:07:00.000+0000"
          }

对于前面的 JSON,警报配置评估三个数据点。检索了两个数据点,其值分别为 22。第三个数据点值缺失,警报评估中考虑了 TMD 选项。TMD 设置为 breaching(超出阈值),缺失的数据点值为超出阈值的值。这会导致警报过渡到 ALARM 状态。

相关信息

使用 Amazon CloudWatch 警报

CloudWatch 警报的常见功能

当监控指标没有任何超出阈值的数据点时,为什么我的 CloudWatch 警报会启动?

AWS 官方
AWS 官方已更新 7 个月前