Como monitorar meu cluster do Amazon OpenSearch Service usando alarmes do CloudWatch?
Quero monitorar meu cluster do Amazon OpenSearch Service quanto a problemas de estabilidade. Como posso monitorar meu cluster de forma eficaz?
Resolução
Importante: versões diferentes do Elasticsearch usam grupos de threads diferentes para processar chamadas para a API _index.
- As versões 1.5 e 2.3 do Elasticsearch usam o grupo de threads de índice.
- As versões 5.x, 6.0 e 6.2 do Elasticsearch usam o grupo de threads em massa. (Atualmente, o console do OpenSearch Service não inclui um gráfico para o grupo de threads em massa.)
- As versões 6.3 e posteriores do Elasticsearch usam o grupo de threads de gravação.
Para monitorar a integridade do cluster do OpenSearch Service, defina os alarmes recomendados do Amazon CloudWatch e os seguintes alarmes de métrica de clusters do OpenSearch Service:
- MasterReachableFromNode
- KibanaHealthyNodes
- DiskQueueDepth
- ThreadpoolIndexQueue
- ThreadpoolSearchQueue
Você pode configurar os alarmes métricos do OpenSearch Service da seguinte forma:
MasterReachableFromNode: Statistic = Maximum Value = ‘=0’ Frequency = 1 period Period = 1 minute Issue: Leader node is down. KibanaHealthyNodes: Statistic = Average Value = ‘=0’ Frequency = 1 period Period = 1 minute Issue: Indicates that the kibana index is unhealthy. DiskQueueDepth: Statistic = Average Value = ‘>=100' Frequency = 1 period Period = 5 minutes Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency. ThreadpoolIndexQueue and ThreadpoolSearchQueue: Statistic = Maximum Value = ‘>=20’ Frequency = 1 period Period = 1 minute Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.
Para configurar um alarme do Amazon CloudWatch para o cluster do OpenSearch Service, execute as seguintes etapas:
1. Abra o console do Amazon CloudWatch.
2. Acesse a guia Alarm (Alarme).
3. Escolha Create alarm (Criar alarme).
4. Escolha Select Metric (Selecionar métrica).
5. Escolha ES para sua métrica.
6. Selecione Per-Domain e Per-Client Metrics (Métricas por domínio e por cliente).
7. Selecione uma métrica e escolha Next (Avançar).
8. Defina as seguintes configurações para o alarme do Amazon CloudWatch:
Statistic = Maximum Period to 1 minute Threshold type = Static Alarm condition = Greater than or equal to Threshold value = 1
9. Escolha a guia Additional configuration (Configuração adicional).
10. Atualize as seguintes configurações:
Datapoints to alarm = Frequency stated above Missing data treatment = Treat missing data as ignore (maintain the alarm state)
11. Selecione Next (Próximo).
12. Escolha a ação que você deseja que o alarme execute e escolha Next (Próximo).
13. Defina um nome para o alarme e escolha Next (Avançar).
14. Escolha Create alarm (Criar alarme).
Observação: se o alarme for acionado para CPUUtilization ou JVMMemoryPressure, verifique suas métricas do Amazon CloudWatch para verificar se há um pico coincidindo com as solicitações recebidas. Especificamente, monitore estas métricas do Amazon CloudWatch: IndexingRate, SearchRate e OpenSearchRequests.
Informações relacionadas
Using Amazon CloudWatch alarms (“Usar alarmes do Amazon CloudWatch”).
Conteúdo relevante
- AWS OFICIALAtualizada há um ano
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há um ano