Como torno meu domínio do Amazon OpenSearch Service mais tolerante a falhas?
Quero proteger os recursos do Amazon OpenSearch Service contra exclusão acidental, falhas de aplicações ou de hardware, ou interrupções. Quais são algumas das práticas recomendadas para melhorar a tolerância a falhas ou restaurar snapshots?
Breve descrição
Para melhorar a tolerância a falhas de um domínio do OpenSearch Service, você pode seguir estas práticas recomendadas:
- Tire snapshots dos índices regularmente.
- Use as métricas do Amazon CloudWatch para monitorar os recursos do OpenSearch Service.
- Entenda os limites do OpenSearch Service.
- Use nós principais dedicados.
- Use pelo menos três nós.
- Habilite o reconhecimento de zona.
- Não use instâncias T2 em ambientes de produção.
Resolução
Tirar snapshots dos índices regularmente
Todos os domínios do OpenSearch Service tiram snapshots automatizados. Tire snapshots dos índices manualmente para criar backups em um ponto anterior no tempo dos dados em um domínio do OpenSearch Service. Armazene os snapshots em um bucket do Amazon Simple Storage Service (Amazon S3). Você também pode usar snapshots de índice manuais para migrar dados entre domínios do OpenSearch Service ou para restaurar dados para outro domínio do OpenSearch Service.
Monitorar métricas do Amazon CloudWatch
- Use as guias Integridade do cluster e Integridade da instância no console do OpenSearch Service para monitorar as métricas do Amazon CloudWatch dos seus clusters.
- Crie alarmes do Amazon CloudWatch para métricas importantes do OpenSearch Service. Por exemplo, monitore a métrica AutomatedSnapshotFailure para confirmar se os snapshots automatizados estão sendo tirados em intervalos regulares. Para ver um tutorial, consulte Get Started with Amazon Elasticsearch Service: Set CloudWatch Alarms on Key Metrics (Introdução ao Amazon OpenSearch Service: definir alarmes do CloudWatch nas métricas chaves).
Usar nós principais dedicados
Os nós principais dedicados ajudam a evitar problemas causados por nós sobrecarregados. Use nós principais dedicados quando:
- Seu domínio for usado em ambientes de produção.
- Seu domínio possuir cinco ou mais nós.
- Seu mapeamento de índice for complexo, com muitos campos definidos entre tipos e índices.
Use pelo menos três nós
Para evitar uma rede particionada involuntariamente (cérebro dividido), use pelo menos três nós. Para evitar possíveis perdas de dados, verifique se você tem pelo menos uma réplica para cada índice. (Por padrão, cada índice tem uma réplica.)
Habilitar reconhecimento de zona
O reconhecimento de zonas ajuda a evitar tempo de inatividade e perda de dados. Quando o reconhecimento de zonas está habilitado, o OpenSearch Service aloca os nós e os fragmentos de índice de réplica em duas ou três zonas de disponibilidade na mesma região da AWS.
Observação: para uma configuração de três zonas de disponibilidade, use duas réplicas de seu índice. Se houver uma falha de zona única, as duas réplicas permitirão 100% de redundância de dados.
Não use instâncias T2 em ambientes de produção
Para ambientes de produção, use instâncias de classe M ou maiores do Amazon Elastic Compute Cloud (Amazon EC2). Se estiver usando tipos de instância T2, monitore os créditos de CPU, o uso da CPU, o uso da memória e a estabilidade das instâncias. Aumente a escala na vertical ou na horizontal quando necessário.
Além disso, observe as seguintes limitações para instâncias T2:
- As instâncias T2 recebem créditos de CPU. Se houver um pico no tráfego de rede, o cluster do OpenSearch Service poderá exceder a quantidade de créditos de CPU disponíveis na instância T2. Para obter mais informações, consulte créditos de CPU e utilização de linha de base para instâncias de performance expansíveis.
- As instâncias T2 contam com um limite de volume do EBS de 35 GB.
- As instâncias T2 têm 10 MB de limite de carga útil. Verifique se a carga útil da solicitação não excede o limite de carga útil. Para obter mais informações sobre os limites de rede do OpenSearch Service, consulte Limites de rede.
- Os tipos de instância T2 só podem ser usados se a contagem de instâncias do OpenSearch Service for dez ou menos. Para obter mais informações sobre os tipos de instância do OpenSearch Service compatíveis, consulte Tipos de instâncias compatíveis.
- Os tipos de instância T2 não devem ser usados como nós de dados ou nós principais dedicados. Os tipos de instância T2 podem se tornar instáveis sob carga pesada sustentada. Para obter mais informações, consulte Práticas recomendadas do OpenSearch Service.
Informações relacionadas
Introdução ao Amazon OpenSearch Service: de quantas instâncias de dados eu preciso?
Criação e gerenciamento de domínios do Amazon OpenSearch Service
Conteúdo relevante
- AWS OFICIALAtualizada há um ano
- AWS OFICIALAtualizada há 4 anos
- AWS OFICIALAtualizada há um ano
- AWS OFICIALAtualizada há 2 anos