- 新しい順
- 投票が多い順
- コメントが多い順
この問題には複数の要因が考えられます。
-
メトリクスの遅延: CloudWatchメトリクスの取り込みに遅延がある可能性があります。Lambda関数の実行時間が30秒ほどであることを考慮すると、メトリクスデータがCloudWatchに到達する前にアラームの評価が行われている可能性があります。
-
欠落データの処理: アラームの設定で「欠落データを見つかりませんとして処理」としていますが、これによりアラームが発生しにくくなっている可能性があります。Step Functionsから実行した場合、何らかの理由でメトリクスデータが欠落していると、アラームが発生しない可能性があります。
-
メトリクスの集計期間: アラームの期間を1分に設定していますが、Step Functionsからの実行の場合、この1分の間にエラーが集計されていない可能性があります。
-
Lambda上のモニタリングとCloudWatchグラフの違い: Lambda上のモニタリングタブはより直接的なエラー情報を表示している可能性がありますが、CloudWatchグラフはメトリクスの集計と遅延の影響を受けやすいです。
改善策として以下が考えられます:
- アラームの評価期間を長くする(例:5分)
- 欠落データの処理を「不良として処理」に変更する
- メトリクス数学を使用して、遅延や欠落データを処理する(例:FILL関数を使用)
- Step Functionsの実行時間を確認し、必要に応じて調整する
これらの調整を行い、Step Functionsから実行した場合でもアラームが適切に発生するか確認してください。
Sources
Elevating Your AWS Observability: Unlocking the Power of Amazon CloudWatch Alarms | AWS Cloud Operations Blog
Reduce code duplication in load testing and synthetic monitoring using Amazon CloudWatch Synthetics | AWS Cloud Operations Blog
関連するコンテンツ
- AWS公式更新しました 3年前
- AWS公式更新しました 2年前
- AWS公式更新しました 1年前
- AWS公式更新しました 3年前