我想在 Amazon CloudWatch 中了解我的警报并评估我的警报过渡状态。
简短描述
当您创建警报时,CloudWatch 警报会根据提供的指标数据评估指定的条件。请注意创建警报时使用的以下属性:
- Metric selection(指标选择)- 要监控的指标。
- Threshold configuration(阈值配置)-调用警报的特定值。
- Evaluation period(评估期限)-警报期限的数量。使用此参数可避免虚假警报。
- DatapointsToAlarm- 调用警报时必须超出的数据点数量。使用它来设置警报灵敏度。
- Period(周期)- 指标数据聚合的时间间隔(例如,每 60 秒)。
- Statistic(统计数据)- 指标数据聚合的类型(例如,MIN 或 AVG)。
- Treat Missing Data (TMD)(处理缺失数据 (TMD))- 用于在指标数据丢失时评估警报的方法。
要了解 CloudWatch 如何评估警报然后处理缺失的数据,请参阅评估警报和配置 CloudWatch 警报对缺失数据的处理方式。
解决方法
要查看 CloudWatch 如何分析检索到的数据点,请在 CloudWatch 中查看您的 Alarm History(警报历史记录):
- 打开 CloudWatch 控制台,然后在导航窗格中选择 Alarms(警报)。
- 选择您的警报,然后选择 History(历史记录)选项卡。在 History(历史记录)选项卡的 Date(日期)列中,超链接的时间戳条目显示警报何时进入 ALARM 状态。
要评估 Alarm History(警报历史记录)中的警报过渡状态,请参阅警报 1 和警报 2 的以下 JSON 示例。对于这两个警报 JSON 示例,请查看以下条件:
- Metric(指标)- HealthyHostCount
- Threshold configuration(阈值配置)- 1(三分钟内不超过 1 个数据点)
- Evaluation period(评估期限)-3 个数据点
- Period(周期)- 1 分钟
- Statistic(统计数据)-最小值
- Treat missing data (TMD)(处理缺失数据 (TMD))- 例如警报 1,treat missing data(处理缺失数据)选项为 missing(缺失)。例如警报 2,treat missing data(处理缺失数据)选项为 breaching(超出阈值)。
警报 1 JSON 示例:
"newState": {
"stateValue": "ALARM",
"stateReason": "Threshold Crossed: 1 out of the last 3 datapoints [1.0 (28/03/24 17:11:00)] was less than or equal to the threshold (1.0) (minimum 1 datapoint for OK -> ALARM transition).",
"stateReasonData": {
"version": "1.0",
"queryDate": "2024-03-28T17:13:09.156+0000",
"startDate": "2024-03-28T17:09:00.000+0000",
"statistic": "Minimum",
"period": 60,
"recentDatapoints": [
2,
2,
1
],
"threshold": 1,
"evaluatedDatapoints": [
{
"timestamp": "2024-03-28T17:11:00.000+0000",
"sampleCount": 2,
"value": 1
}
对于前面的 JSON,检索了三个数据点,其值分别为 2、2 和 1。警报过渡到 ALARM 状态,因为最后 3 个数据点中的 1 个小于或等于阈值 1。
**注意:**evaluatedDatapoints 参数显示了有关超出阈值数据点的详细信息。对于前面的 JSON,CloudWatch 收到了 2 个样本。当这些样本按 Minimum(最小值)统计数据聚合时,返回的数据点为 1。该值超过了 less than or equal to 1(小于或等于 1)的阈值。结果,警报过渡到 ALARM 状态。
警报 2 JSON 示例:
"newState": {
"stateValue": "ALARM",
"stateReason": "Threshold Crossed: 2 datapoints were received for 3 periods and 1 missing datapoint was treated as [Breaching].",
"stateReasonData": {
"version": "1.0",
"queryDate": "2024-03-28T20:09:52.566+0000",
"startDate": "2024-03-28T20:00:00.000+0000",
"statistic": "Minimum",
"period": 60,
"recentDatapoints": [
2,
2
],
"threshold": 1,
"evaluatedDatapoints": [
{
"timestamp": "2024-03-28T20:07:00.000+0000"
}
对于前面的 JSON,警报配置评估三个数据点。检索了两个数据点,其值分别为 2 和 2。第三个数据点值缺失,警报评估中考虑了 TMD 选项。TMD 设置为 breaching(超出阈值),缺失的数据点值为超出阈值的值。这会导致警报过渡到 ALARM 状态。
相关信息
使用 Amazon CloudWatch 警报
CloudWatch 警报的常见功能
当监控指标没有任何超出阈值的数据点时,为什么我的 CloudWatch 警报会启动?