Como posso ter certeza de que os alarmes do CloudWatch ativam ações?

3 minuto de leitura
0

Meu alarme do Amazon CloudWatch não está ativado, embora eu possa ver em meus gráficos do CloudWatch que a métrica do alarme excede o limite configurado. Quero ter certeza de que meus alarmes do CloudWatch estão ativados e realizar as ações de alarme.

Breve descrição

Os alarmes do CloudWatch monitoram continuamente as métricas agregadas por tempo em uma janela contínua. Se todos os pontos de dados coletados durante o período de avaliação não excederem o limite configurado, o alarme do CloudWatch não será ativado.

Os alarmes do CloudWatch iniciam ações quando o estado do alarme muda e são mantidos por um determinado número de períodos. Para obter mais informações, consulte Como usar alarmes do Amazon CloudWatch.

**Importante:**Se um alarme estiver em um estado especificado, o alarme do CloudWatch ativará continuamente as ações do Amazon EC2 Auto Scaling. Se nenhum estado mudar e o alarme permanecer no estado especificado, a atividade continuará.

Solução

Para medir métricas agregadas por tempo ao criar alarmes, verifique o mecanismo que o CloudWatch usa.

Para garantir que o alarme funcione corretamente, reduza os limites de dados métricos.

Exemplo de solução de problemas

No exemplo a seguir, um alarme observa a utilização média da CPU. O alarme é configurado com um limite maior que 45 e um período de 5 minutos. Tanto o período de avaliação quanto os pontos de dados do alarme são 3. Se todos os pontos de dados existentes nos três períodos consecutivos mais recentes estiverem acima do limite, o alarme mudará para o estado ALARM. O alarme funciona por três períodos consecutivos de 5 minutos.

O intervalo de avaliação é de 15 minutos para as métricas agregadas por tempo:

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=41.685}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.846}
  • 06:00:00: data: {Avg=61.123}

Para obter mais informações, consulte Avaliação de um alarme.

Esses pontos de dados resultam nos estados de alarme a seguir:

  • ALARM 05:35
  • ALARME 05:40
  • ALARME 05:45 até OK
  • OK 05:50
  • OK 05:55
  • 06:00 OK para ALARM

O ponto de dados coletado às 05:55 excede o limite médio de utilização da CPU de 45%. No entanto, o alarme segue no estado OK e não ativa a ação às 05:55. Como o ponto de dados coletado às 05:45:00 não excede o limite e é incluído na avaliação às 05:55, nenhuma ação acontece. No entanto, cinco minutos depois, o alarme inicia a ação porque o estado do alarme muda de OK para ALARM às 06:00.

Para as seguintes métricas agregadas por tempo, os pontos de dados excedem o limite médio de utilização da CPU em 45%, então o estado do alarme muda para ALARM após 05:25:00. Como não há mudanças de estado, a ação de alarme não é ativada.

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=45.075}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.847}
  • 06:00:00: data: {Avg=61.123}

Informações relacionadas

Escalabilidade dinâmica para Amazon EC2 Auto Scaling

Exibir métricas disponíveis