Je souhaite résoudre une alarme Amazon CloudWatch qui ne se déclenche pas.
Brève description
Les alarmes CloudWatch évaluent les métriques en fonction des points de données disponibles au moment de l'évaluation de l'alarme. Les alarmes standard évaluent chaque minute et les alarmes haute résolution toutes les 10 secondes. Si les points de données collectés ne dépassent pas le seuil dans les fenêtres spécifiées, l'alarme reste à l'état OK.
Remarque : Les fenêtres sont les intervalles de temps pendant lesquels CloudWatch analyse les données pour déterminer si une alarme est ou non déclenchée. La Période et le nombre de Périodes d'évaluation définissent la fenêtre comme un intervalle de temps.
Les causes possibles d'une alarme qui n’est pas invoquée sont les suivantes :
- Une alarme Amazon CloudWatch vient de se déclencher.
- Pour les métriques périodiques et axées sur les événements, les alarmes peuvent ne pas être invoquées si les points de données n'ont pas été transférés à la métrique pendant la période d'évaluation.
- La métrique n'est pas disponible.
- Les paramètres de métrique, tels que espace de noms, nom de la métrique ou dimensions, sont incorrectement configurés.
- La métrique ne contient pas suffisamment de données pour déterminer l'état de l'alarme.
Résolution
Vérifier les configurations des filtres de métriques
Pour les métriques créées par un filtre de métriques, vérifiez les points suivants :
- Si vous utilisez un filtre de métrique basé sur CloudWatch Logs, assurez-vous que les journaux attendus sont générés et que le filtre est correctement défini.
- Vérifiez que les événements de journaux incluent les valeurs attendues dans le modèle de filtre de métriques. Pour vous assurer que le modèle correspond comme prévu, testez-le par rapport à des exemples d'événements de journaux.
- Pour vous assurer que la valeur statistique mathématique correcte est configurée, vérifiez la configuration de l'alarme.
Utiliser un paramètre « Alarme M sur N »
Remarque : Pour la résolution suivante, M représente les points de données consécutifs supérieurs au seuil requis pour déclencher l'alarme. N représente le total des points de données compris dans la période d'évaluation.
Chaque évaluation d'alarme ultérieure peut utiliser différents points de données agrégés en raison des points de données qui continuent de circuler dans la métrique CloudWatch. Lorsque vous consultez l'historique des événements ultérieurement, un ensemble complet de points de données apparaît. Les alarmes CloudWatch utilisent les points de données disponibles au moment de l'évaluation pour évaluer les métriques. Cependant, de nouveaux points de données peuvent être publiés après une évaluation de l’alarme. Ces nouveaux points de données peuvent affecter les données des métriques. Pour résoudre ce problème, configurez une « alarme M sur N » afin que vos alarmes CloudWatch évaluent davantage de points de données.
Exemple de scénario :
Une alarme M sur N pour CPUUtilization est configurée, où M est égal à 2, N est égal à 3 et la période est de 5 minutes. Puisque N est égal à 3, la période d'évaluation est de 15 minutes. Comme M est égal à 2, si CPUUtilization dépasse le seuil pendant deux des trois dernières périodes de 5 minutes, l'alarme est invoquée.
- Si, au bout de 10 minutes, CPUUtilization est de 85 %, l'alarme est inférieure au seuil de 90 %.
- Si, au bout de 15 minutes, CPUUtilization est de 92 %, l'alarme est supérieure au seuil de 90 %.
- Si, après 20 minutes, CPUUtilization est de 94 %, l'alarme est supérieure au seuil. L'alarme est déclenchée parce que l'exigence selon laquelle le seuil doit être dépassé pendant deux des trois dernières périodes de 5 minutes est respectée.
Pour configurer un paramètre d’alarme M sur N, procédez comme suit :
- Ouvrez la console CloudWatch.
- Dans le volet de navigation, sélectionnez Alarmes, puis Toutes les alarmes.
- Localisez et sélectionnez l'alarme que vous souhaitez configurer pour M sur N.
- Sélectionnez le menu déroulant des actions, puis Modifier.
- Sélectionnez Configuration supplémentaire. Assurez-vous que la première valeur spécifiée est inférieure à la deuxième valeur. Cette configuration détermine le nombre de points de données consécutifs supérieurs au seuil requis pour invoquer l'alarme.
Informations connexes
Pourquoi mon alarme CloudWatch s'est-elle déclenchée alors que sa métrique ne contient aucun point de données hors limites ?
Agrégation