Passer au contenu

Pourquoi mon instance de réplication AWS DMS a-t-elle redémarré ou basculé ?

Lecture de 4 minute(s)
0

Je souhaite résoudre les problèmes liés au redémarrage ou au basculement de mon instance de réplication AWS Database Migration Service (AWS DMS).

Brève description

Une instance de réplication AWS DMS redémarre automatiquement pour les raisons suivantes :

  • L'instance principale présente un problème d'infrastructure, tel qu'une perte de connectivité réseau, un problème d'unité de calcul ou un problème de stockage.
  • Le type de classe d'instance a changé à la suite d'une activité de mise à l'échelle verticale.
  • Un correctif logiciel est en cours sur l'hôte de l'instance pendant une fenêtre de maintenance spécifique. Pour plus d'informations, consultez la section Utilisation des versions de moteur de réplication.
  • Vous avez utilisé les options Redémarrer ou Redémarrer avec basculement planifié pour effectuer un redémarrage manuel de l'instance.

Lorsque l'instance de réplication rencontre des problèmes et ne répond pas aux surveillances de l’état d'AWS DMS, AWS DMS lance automatiquement une restauration ou un basculement. Pour les déploiements mono-AZ, AWS DMS lance une restauration. Pour un déploiement multi-AZ, AWS DMS lance un basculement. Puis, AWS DMS redémarre l'instance de réplication avant que vous ne puissiez reprendre manuellement les tâches de migration de base de données.

Résolution

Examiner les événements AWS DMS pour en identifier la cause racine

Pour identifier la cause du redémarrage ou du basculement de votre instance, consultez les événements AWS DMS des dernières 24 heures. Ouvrez la console AWS DMS et choisissez Événements.

Remarque : Par défaut, AWS DMS enregistre les événements dans le fuseau horaire UTC.

Pour stocker des événements pendant une longue période, envoyez les événements AWS DMS à Amazon EventBridge. Pour plus d'informations, consultez la section Implémenter une approche automatisée pour gérer les événements opérationnels d'AWS DMS.

Si le message d'événement Instance de réplication corrigée s'affiche, cela signifie qu'une mise à niveau de la version du moteur vers l'instance de réplication a été effectuée. Une mise à niveau peut avoir lieu immédiatement après la modification de l'instance ou pendant votre fenêtre de maintenance planifiée.

Si le type de classe d'instance change, le message d'événement La classe d'instance de réplication pour cette instance de réplication est en cours de modification ou La classe d'instance de réplication de cette instance de réplication a changé s'affiche. Les déploiements mono-AZ ne sont pas disponibles pendant quelques minutes lors d'une opération de mise à l’échelle. Les déploiements multi-AZ ne sont pas disponibles pendant la durée du basculement. Le basculement prend généralement 60 secondes. AWS DMS met à niveau la base de données de secours avant que la base de données nouvellement dimensionnée ne bascule.

Les messages d'événement Basculement des instances multi-AZ démarré ou Basculement des instances multi-AZ terminé peuvent s'afficher pour les raisons suivantes :

  • L'instance de réplication principale ne répond pas.
  • L'instance a été redémarrée manuellement avec les options Redémarrer ou Redémarrer avec basculement planifié.
  • L'instance de réplication rencontre des problèmes de réseau intermittents avec l'hôte sous-jacent.

Surveiller les métriques d’AWS DMS grâce au tableau de bord de surveillance amélioré

AWS DMS fournit des métriques depuis le tableau de bord de surveillance amélioré à Amazon CloudWatch Logs. Consultez le journal d’instances de réplication pour obtenir les métriques de performance, d'utilisation des ressources et d’état.

Remarque : Les réplications sans serveur AWS DMS ne prennent pas en charge la surveillance améliorée.

Activer les déploiements multi-AZ pour réduire la durée d’indisponibilité

Pour réduire la durée d’indisponibilité, activez les déploiements multi-AZ. Dans un déploiement multi-AZ, un réplica de secours de l'instance de réplication est disponible dans une autre zone de disponibilité. Pour plus d'informations, consultez la section Résilience dans AWS Database Migration Service.

Remarque : Pour les instances qui utilisent Amazon Simple Storage Service (Amazon S3) en tant que cible, AWS DMS peut écrire des enregistrements dupliqués dans votre compartiment S3. Cela se produit lorsque vous reprenez votre tâche après un redémarrage ou un basculement et que le TargetTablePrepMode est défini sur DO_NOTHING.

Informations connexes

Bonnes pratiques relatives à AWS Database Migration Service

Utilisation d’une instance de réplication AWS DMS

AWS OFFICIELA mis à jour il y a 3 mois