CloudWatch アラームがアクションをアクティブ化することを確認するにはどうすればよいですか?

所要時間1分
0

CloudWatch グラフから、アラームのメトリクスが設定したしきい値を超えていることがわかりますが、Amazon CloudWatch アラームはアクティブ化されません。確実に CloudWatch アラームをアクティブ化し、アラームアクションが実行されるようにするには、どうすればよいですか?

簡単な説明

時間集計メトリクス (5 分の平均値など) を測定する CloudWatch アラームは、ローリングウィンドウでこの測定を継続的に実行します。評価期間中に収集されたすべてのデータポイントが、設定したしきい値を超えない場合、CloudWatch アラームはアクティブ化されません。

CloudWatch アラームがアクションを開始するのは、アラームの状態が変化し、指定された数の期間にわたり維持された場合のみです。詳細については、「CloudWatch アラームの作成」を参照してください。

重要: Amazon EC2 Auto Scaling アクションに関連付けられている CloudWatch アラームには、この動作の例外があります。CloudWatch アラームは、そのアラームが指定された状態にあるときに Auto Scaling アクションをアクティブ化し続けます。これは、状態の変化がなく、アラームがその状態のままであっても発生します。

解決方法

アラームを作成するときは、時間集計メトリクスを測定するために CloudWatch で使用されるメカニズムについて必ず検討します。

アラームが予期どおり動作するよう、メトリクスデータのしきい値を下げることを検討します。

トラブルシューティング例

この例では、CPU の平均利用率に基づくアラームがあります。アラームは 45 を超えるしきい値で設定されています。少なくとも 3 つの連続した期間、5 分間実行されます。評価期間は、次の時間集計メトリクスの 3 秒と 300 秒です。

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=41.685}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.846}
  • 06:00:00: data: {Avg=61.123}

これらのデータポイントは、次のアラーム状態になります。

  • 05:35 ALARM
  • 05:40 ALARM
  • 05:45 ALARM から OK へ
  • 05:50 OK
  • 05:55 OK
  • 06:00 OK から ALARM へ

05:55 に収集されたデータポイントは、平均 CPU 使用率のしきい値の 45% を超えています。ただし、アラームは OK 状態のままで、05:55 でアクションをアクティブ化しません。この理由は、05:45:00 に収集されたデータポイント (しきい値を超えない) が、05:55 での評価に含まれているためです。ただし、5 分後にアラームはアクションをアクティブ化します。これはアラームの状態が 06:00 に OK から ALARM に変わるためです。

以下の時間集計メトリクスでは、アラームの状態は 05:35 以降に ALARM になります。すべてのデータポイントが平均 CPU 使用率のしきい値 45% を超えるためです。状態の変更がないため、アラームアクションはアクティブ化されません。

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=45.075}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.847}
  • 06:00:00: data: {Avg=61.123}

関連情報

Amazon EC2 Auto Scaling の動的なスケーリング

利用可能なメトリクスの表示

AWS公式
AWS公式更新しました 2年前