使用AWS re:Post即您表示您同意 AWS re:Post 使用条款

如何对监控 CloudWatch 代理指标且处于 INSUFFICIENT_DATA 状态的 CloudWatch 警报进行故障排除?

1 分钟阅读
0

我想对监控 CloudWatch 代理指标且处于 INSUFFICIENT_DATA 状态的 Amazon CloudWatch 警报进行故障排除。

解决方法

检查配置文件

确保指标描述(例如指标名称和维度)与代理用于发布指标的 CloudWatch 代理配置文件相匹配。

您可以在以下位置找到配置文件:

  • 对于 Linux:/opt/aws/amazon-cloudwatch-agent/bin/config.json
  • 对于 Windows: C:\Program Files\Amazon\AmazonCloudWatchAgent\amazon-cloudwatch-agent.json

以下是 CloudWatch 代理配置文件和警报配置之间不匹配的示例。

配置文件示例:

{
"metrics": {
    "namespace": "CWAgent",
    "metrics_collected": {
        "cpu": {
        "measurement": [
        "usage_idle"
        ],
        "metrics_collection_interval": 60,
        "totalcpu": false
            }
        }
    }
}

警报使用以下配置:

  • 指标名称:cpu_utilization
  • 维度: InstanceId
  • 统计数据: 平均值
  • 时间: 60 秒
  • 阈值: 80%

在前面的示例中,指标名称不匹配。要解决此问题,请确保指标名称相同。

检查 IAM 权限

检查附加到 Amazon Elastic Compute Cloud (Amazon EC2) 实例的 AWS Identity and Access Management (IAM) 角色的权限。IAM 角色必须拥有执行 PutMetricData 操作的权限。为确保该角色拥有 CloudWatch 代理的所有权限,请将 CloudWatchAgentServerPolicy 附加到该角色。

有关详细信息,请参阅为什么统一的 CloudWatch 代理不将我的指标或日志事件推送到 CloudWatch?

检查 CloudWatch 代理的日志文件

在 CloudWatch 代理日志文件中,检查是否有表明连接、权限、配置或指标收集存在问题的消息。

您可以在以下位置找到日志:

  • 对于 Linux:/var/log/amazon/amazon-cloudwatch-agent/amazon-cloudwatch-agent.log
  • 对于 Windows: C:\ProgramData\Amazon\AmazonCloudWatchAgent\Logs\amazon-cloudwatch-agent.log

检查网络连接

确保您的 EC2 实例可以连接到互联网并允许 CloudWatch 代理向 CloudWatch 端点发送数据。如果您的实例无法直接连接到互联网,请使用 Amazon Virtual Private Cloud (Amazon VPC) 端点。确保与 Amazon VPC 端点关联的安全组允许来自该实例的入站流量。

有关详细信息,请参阅为什么统一的 CloudWatch 代理不将我的指标或日志事件推送到 CloudWatch?

测试指标集合

**注意:**如果在运行 AWS 命令行界面 (AWS CLI) 命令时收到错误,请参阅 AWS CLI 错误故障排除。此外,请确保您使用的是最新版本的 AWS CLI

要手动测试收集和发布指标的流程,请在运行 CloudWatch 代理的实例上运行 put-metric-data 命令。

相关信息

如何对处于 INSUFFICIENT_DATA 状态的 CloudWatch 警报进行故障排除?

如何安装和配置统一的 CloudWatch 代理,以便将指标和日志从我的 EC2 实例推送到 CloudWatch?

如何对我的 Amazon CloudWatch 指标中缺失的数据点问题进行故障排除?

AWS 官方
AWS 官方已更新 20 年前