Como posso realizar um failover no meu Aurora Global Database e por que meu failover falhou?
Quero saber como realizar o failover no Amazon Aurora Global Database compatível com PostgreSQL e os motivos pelos quais um failover falhou.
Resolução
Para um Aurora Global Database, há duas opções diferentes para realizar um failover:
- Failover manual não planejado (“desconectar e promover”): use esta opção para se recuperar de uma paralisação não planejada ou para fazer testes de recuperação de desastres.
- Failover planejado gerenciado: use esta opção para manutenção operacional ou outros procedimentos operacionais planejados.
Failover manual não planejado
Para fazer o failover para um cluster secundário após uma interrupção não planejada na região primária da AWS, primeiro faça o seguinte:
- Pare de emitir declarações DML e outras operações de gravação no cluster de banco de dados principal do Aurora na região da AWS com a interrupção.
- Identifique um cluster de banco de dados do Aurora de uma região secundária da AWS para usar como um novo cluster de banco de dados primário. Se você tiver duas ou mais regiões secundárias da AWS em seu Aurora Global Database, escolha o cluster secundário que tenha o menor tempo de atraso.
- Remova o cluster de banco de dados secundário escolhido do Aurora Global Database.
Em seguida, para concluir o failover manual não planejado, faça o seguinte:
- Reconfigure seu aplicativo para enviar todas as operações de gravação para o cluster de banco de dados do Aurora, agora independente, usando seu novo endpoint. Se você aceitou os nomes fornecidos ao criar o Aurora Global Database, altere o endpoint removendo o -ro da string de endpoint do cluster.
Por exemplo, o endpoint do cluster secundário my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com torna-se my-global.cluster-aabb.us-west-1.rds.amazonaws.com quando esse cluster é separado do Aurora Global Database.
O cluster secundário de banco de dados do Aurora se torna o cluster primário de um novo banco de dados global do Aurora quando você começa a adicionar regiões a ele. - Adicione uma região da AWS ao cluster de banco de dados para iniciar o processo de replicação do cluster primário para o secundário.
- Adicione mais regiões da AWS conforme necessário para recriar a topologia necessária para dar suporte à sua aplicação.
Para obter mais informações, consulte Como recuperar um Amazon Aurora Global Database de uma paralisação não planejada.
Failover planejado e gerenciado
Para iniciar um failover planejado gerenciado para seu Amazon Aurora Global Database, faça o seguinte:
- Abra o console do Amazon RDS.
- Escolha Databases e encontre o Aurora Global Database para o qual você deseja usar.
- No menu Ações, escolha Failover do global database. O failover agora está pendente e o processo só começa depois de você escolher o destino do failover.
- Escolha o cluster secundário de banco de dados do Aurora que você deseja promover para primário. O cluster de banco de dados secundário deve estar disponível.
Observação: se você tiver mais de um cluster de banco de dados secundário, compare a quantidade de atraso para todos os secundários. Em seguida, escolha aquele com a menor quantidade de atraso. - Escolha Failover global database para confirmar sua escolha de cluster de banco de dados secundário e iniciar o processo de failover.
A coluna Status da lista de bancos de dados mostra o estado de cada instância de banco de dados do Aurora e cluster de banco de dados do Aurora durante o processo de failover.
A barra de status na parte superior do console exibe o progresso e fornece a opção Cancelar failover.
Se você escolher Cancelar failover, terá a opção de continuar com o failover ou cancelar o processo de failover. - Escolha Fechar para continuar a falha e ignorar a solicitação.
Depois que o failover for concluído, você poderá ver os clusters de banco de dados do Aurora e seu estado atual na lista Databases. Para obter mais informações, consulte Como executar failovers planejados gerenciados para Amazon Aurora Global Databases.
Você também pode usar a AWS Command Line Interface (AWS CLI) para iniciar um failover planejado gerenciado executando o comando failover-global-cluster.
Razões para uma falha no failover
Um failover pode falhar devido a um dos seguintes motivos:
- Atraso de replicação entre a origem e o destino
- Falhas na zona de disponibilidade
- Falhas no nó de computação
- Problemas de rede entre instâncias de banco de dados
- Problemas de armazenamento
- Eventos de grande escala
Informações relacionadas
Conteúdo relevante
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há 2 anos