我想对监控 CloudWatch 代理指标且处于 INSUFFICIENT_DATA 状态的 Amazon CloudWatch 警报进行故障排除。
确保指标描述(例如指标名称和维度)与代理用于发布指标的 CloudWatch 代理配置文件相匹配。
您可以在以下位置找到配置文件:
以下是 CloudWatch 代理配置文件和警报配置之间不匹配的示例。
配置文件示例:
{ "metrics": { "namespace": "CWAgent", "metrics_collected": { "cpu": { "measurement": [ "usage_idle" ], "metrics_collection_interval": 60, "totalcpu": false } } } }
警报使用以下配置:
在前面的示例中,指标名称不匹配。要解决此问题,请确保指标名称相同。
检查附加到 Amazon Elastic Compute Cloud (Amazon EC2) 实例的 AWS Identity and Access Management (IAM) 角色的权限。IAM 角色必须拥有执行 PutMetricData 操作的权限。为确保该角色拥有 CloudWatch 代理的所有权限,请将 CloudWatchAgentServerPolicy 附加到该角色。
有关详细信息,请参阅为什么统一的 CloudWatch 代理不将我的指标或日志事件推送到 CloudWatch?
在 CloudWatch 代理日志文件中,检查是否有表明连接、权限、配置或指标收集存在问题的消息。
您可以在以下位置找到日志:
确保您的 EC2 实例可以连接到互联网并允许 CloudWatch 代理向 CloudWatch 端点发送数据。如果您的实例无法直接连接到互联网,请使用 Amazon Virtual Private Cloud (Amazon VPC) 端点。确保与 Amazon VPC 端点关联的安全组允许来自该实例的入站流量。
**注意:**如果在运行 AWS 命令行界面 (AWS CLI) 命令时收到错误,请参阅 AWS CLI 错误故障排除。此外,请确保您使用的是最新版本的 AWS CLI。
要手动测试收集和发布指标的流程,请在运行 CloudWatch 代理的实例上运行 put-metric-data 命令。
如何对处于 INSUFFICIENT_DATA 状态的 CloudWatch 警报进行故障排除?
如何安装和配置统一的 CloudWatch 代理,以便将指标和日志从我的 EC2 实例推送到 CloudWatch?
如何对我的 Amazon CloudWatch 指标中缺失的数据点问题进行故障排除?