Passer au contenu

Pourquoi mon cluster Amazon Aurora compatible avec PostgreSQL a-t-il basculé ?

Lecture de 5 minute(s)
0

Je souhaite connaître les causes des événements de basculement dans mon cluster de bases de données (DB) Amazon Aurora édition compatible avec PostgreSQL.

Brève description

Lorsque l'un des événements suivants se produit, Aurora compatible avec PostgreSQL bascule automatiquement vers une instance de lecteur :

  • L'instance d’enregistreur présente des problèmes d'infrastructure. Cela inclut une perte de connectivité réseau avec le volume de l'hôte physique ou du cluster, ou des problèmes liés aux ressources de calcul physiques.
  • L'instance d’enregistreur n'est pas accessible. Ce problème se produit lorsqu'une charge de travail excessive entraîne des goulots d'étranglement des performances et des conflits de ressources.
  • Le type de classe d'instance de base de données de l’enregistreur change en raison de la mise à l'échelle verticale de l’instance de base de données.
  • L'hôte sous-jacent de l'enregistreur fait l’objet de correctifs logiciels, d’une maintenance matérielle ou d’une mise à jour du système d'exploitation (OS) au cours d'une fenêtre de maintenance spécifique. Pour en savoir plus, consultez la section Maintenance d'un cluster de bases de données Amazon Aurora.
  • L'instance utilise l'option de basculement au niveau de l'instance.

Résolution

Lorsque l'enregistreur du cluster ne répond pas aux surveillances de l’état, le cluster lance un basculement vers l'un des lecteurs selon la priorité. Pour identifier la cause du basculement, consultez les journaux et les métriques suivants pour votre cluster Aurora compatible avec PostgreSQL.

Événements Amazon RDS

Pour identifier la cause d'une panne imprévue, visualisez tous les événements Aurora survenus pendant la période de basculement. Vous pouvez consulter les événements des 2 dernières semaines. Pour stocker des événements pendant une période plus longue, envoyez les événements Aurora à Amazon EventBridge. Pour plus d'informations, consultez la section Création d'une règle qui se déclenche lors d'un événement Amazon Aurora.

Métriques CloudWatch

Pour vérifier si une charge de base de données élevée a provoqué le basculement, utilisez Amazon CloudWatch pour consulter les métriques de votre cluster de bases de données Aurora.

Vérifiez la présence de pics dans les métriques suivantes qui indiquent la disponibilité et l'état de votre cluster :

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth
  • StorageNetworkThroughput

Surveillance améliorée

Utilisez la surveillance améliorée pour consulter les métriques du système d'exploitation en temps réel. Pour activer la surveillance améliorée pour vos instances Amazon Aurora, consultez la section Configuration et activation de la surveillance améliorée. Pour obtenir la liste des métriques du système d'exploitation que vous pouvez consulter, consultez la section Métriques du système d'exploitation dans la surveillance améliorée.

Performance Insights

Utilisez Performance Insights pour visualiser la charge de base de données sur votre cluster Aurora compatible avec PostgreSQL. Vous pouvez filtrer la charge en fonction des attentes, des instructions SQL, des hôtes ou des utilisateurs. Pour plus d'informations, consultez la section Analyse des métriques à l'aide du tableau de bord Performance Insights.

Performance Insights affiche les requêtes qui contribuent le plus à la charge de la base de données, comme une requête qui utilise 99 % de la charge de la base de données.

Performance Insights vous aide à déterminer si les problèmes suivants peuvent affecter les performances du cluster de bases de données :

  • Opérations d'E/S, telles que IO:DataFileRead pour les lectures de disque
  • Contentions de verrouillage, telles que Lock:transactionid et Lock:Relation
  • Problèmes de gestion de la mémoire tampon, tels que BufferPin:BufferPin
  • Retards de communication avec le client, tels que Client:ClientRead et Client:ClientWrite

Important : Performance Insights atteindra sa fin de vie le 30 juin 2026. Vous pouvez effectuer une mise à niveau vers le mode Avancé de Database Insights avant le 30 juin 2026. Si vous n'effectuez pas de mise à niveau, les clusters de bases de données qui utilisent Performance Insights passeront par défaut au mode Standard de Database Insights. Seul le mode Avancé de Database Insights prendra en charge les plans d'exécution et l’analyse à la demande. Si vos clusters passent par défaut en mode Standard, il est possible que vous ne puissiez pas utiliser ces fonctionnalités sur la console. Pour activer le mode Avancé, consultez la section Activation du mode Avancé de Database Insights pour Amazon RDS. Consultez également la section Activation du mode Avancé de Database Insights pour Amazon Aurora.

Journaux de base de données Aurora

Dans les bases de données locales, les journaux de base de données résident sur le système de fichiers. Étant donné qu’il n’est pas possible d’accéder à l'hôte des journaux de base de données sur le système de fichiers, publiez plutôt vos journaux sur Amazon CloudWatch Logs.

Vous pouvez également utiliser la console Amazon RDS pour consulter un fichier journal de base de données.

Basculement rapide avec Aurora PostgreSQL

Pour passer rapidement des opérations à une instance de réplica saine après un basculement, configurez votre application pour un basculement rapide.

Restauration rapide après basculement grâce à la gestion du cache de cluster pour Aurora compatible avec PostgreSQL

Pour une restauration rapide de votre instance de base de données dans votre cluster de bases de données, utilisez la gestion du cache de cluster pour Aurora compatible avec PostgreSQL.

Proxy RDS pour améliorer les performances de basculement

Utilisez le proxy Amazon RDS pour conserver un groupe ouvert de connexions aux instances de base de données. Lors des basculements de base de données, le proxy RDS continue d'accepter les connexions à la même adresse IP et dirige automatiquement les connexions vers la nouvelle instance de base de données principale. Lorsque l'instance de base de données d'origine devient indisponible, le proxy RDS se connecte à la base de données de secours, mais n'interrompt pas les connexions aux applications inactives.

Informations connexes

Haute disponibilité pour Amazon Aurora

Surveillance des métriques dans un cluster Amazon Aurora

Catégories d'événements Amazon RDS et messages d'événements pour Aurora

AWS OFFICIELA mis à jour il y a 6 mois