Help us improve the AWS re:Post Knowledge Center by sharing your feedback in a brief survey. Your input can influence how we create and update our content to better support your AWS journey.
Warum ist bei meinem Cluster von Amazon Aurora PostgreSQL-Compatible ein Failover aufgetreten?
Ich möchte wissen, was Failover-Ereignisse in meinem Datenbank (DB)-Cluster von Amazon Aurora PostgreSQL-Compatible Edition verursacht.
Kurzbeschreibung
Wenn eines der folgenden Ereignisse eintritt, wechselt Aurora PostgreSQL-Compatible automatisch zu einer Reader-Instance:
- Es gibt Infrastrukturprobleme mit der Writer-Instance. Dazu gehören der Verlust der Netzwerkkonnektivität zum physischen Host- oder Cluster-Volume oder Probleme mit den physischen Computerressourcen.
- Die Writer-Instance ist nicht erreichbar. Dieses Problem tritt auf, wenn eine übermäßige Workload zu Leistungsengpässen und Ressourcenkonflikten führt.
- Der DB-Instance-Klassentyp des Writers ändert sich aufgrund der vertikalen Skalierung der DB-Instance.
- Der dem Writer zugrundeliegende Host erfährt während eines bestimmten Wartungsfensters Software-Patches, Hardwarewartungen oder ein Betriebssystem-Update. Weitere Informationen findest du unter Warten eines Amazon-Aurora-DB-Clusters.
- Die Instance verwendet die Failover-Option auf Instance-Ebene.
Lösung
Wenn der Writer des Clusters nicht auf Zustandsprüfungen reagiert, startet der Cluster je nach Priorität ein Failover zu einem der Reader. Um herauszufinden, was das Failover verursacht hat, überprüfe die folgenden Protokolle und Metriken für den Aurora-PostgreSQL-Compatible-Cluster.
Amazon-RDS-Ereignisse
Um die Ursache eines ungeplanten Ausfalls zu ermitteln, sieh dir alle Aurora-Ereignisse aus dem Failover-Zeitraum an. Du kannst Ereignisse der letzten 2 Wochen anzeigen. Um Ereignisse für einen längeren Zeitraum zu speichern, sende die Aurora-Ereignisse an Amazon EventBridge. Weitere Informationen findest du unter Eine Regel erstellen, die bei einem Amazon-Aurora-Ereignis ausgelöst wird.
CloudWatch-Metriken
Um zu überprüfen, ob eine hohe DB-Auslastung das Failover verursacht hat, verwende Amazon CloudWatch, um die Aurora-DB-Cluster-Metriken anzuzeigen.
Suche nach Spitzen in den folgenden Metriken, die die Verfügbarkeit und den Integritätsstatus der Clusters anzeigen:
- DatabaseConnections
- CPUUtilization
- FreeableMemory
- DiskQueueDepth
- StorageNetworkThroughput
Enhanced Monitoring
Verwende Enhanced Monitoring, um Betriebssystem-Metriken in Echtzeit anzuzeigen. Informationen zum Aktivieren von Enhanced Monitoring für die Amazon-Aurora-Instances findest du unter Enhanced Monitoring einrichten und aktivieren. Eine Liste der Betriebssystem-Metriken, die du anzeigen kannst, findest du unter Betriebssystem-Metriken in Enhanced Monitoring.
Performance Insights
Verwende Performance Insights, um die DB-Auslastung auf dem Aurora-PostgreSQL-Compatible-Cluster anzuzeigen. Du kannst die Auslastung nach Wartezeiten, SQL-Anweisungen, Hosts oder Benutzern filtern. Weitere Informationen findest du unter Analysieren von Metriken mit dem Performance-Insights-Dashboard.
Performance Insights zeigt Abfragen, die am meisten zur DB-Auslastung beitragen, z. B. eine Abfrage, die 99 % der DB-Auslastung nutzt.
Mit Performance Insights kannst du feststellen, ob die folgenden Probleme möglicherweise die Leistung des DB-Clusters beeinträchtigen:
- E/A-Operationen wie IO:DataFileRead für Festplattenlesevorgänge
- Sperrkonflikte wie Lock:transactionid und Lock:Relation
- Probleme mit der Pufferverwaltung, z. B. BufferPin:BufferPin
- Verzögerungen bei der Client-Kommunikation, z. B. Client:ClientRead und Client:ClientWrite
Wichtig: Performance Insights wird am 30. Juni 2026 das Ende seiner Lebensdauer erreichen. Du kannst vor dem 30. Juni 2026 ein Upgrade auf den Modus „Erweitert“ von Database Insights durchführen. Wenn du kein Upgrade durchführst, verwenden DB-Cluster, die Performance Insights verwenden, standardmäßig den Modus „Standard“ von Database Insights. Nur der Modus „Erweitert“ von Database Insights unterstützt Ausführungspläne und On-Demand-Analysen. Wenn die Cluster standardmäßig auf den Modus „Standard“ eingestellt sind, kannst du diese Funktionen möglicherweise nicht auf der Konsole verwenden. Informationen zum Aktivieren des Modus „Erweitert“ findest du unter Den Modus „Erweitert“ von Database Insights für Amazon RDS aktivieren. Weitere Informationen findest du unter Den Modus „Erweitert“ von Database Insights für Amazon Aurora aktivieren.
Aurora-DB-Protokolle
Bei On-Premises-Datenbanken befinden sich die DB-Protokolle im Dateisystem. Da du auf den Host für die DB-Protokolle nicht im Dateisystem zugreifen kannst, veröffentliche die Protokolle stattdessen in Amazon CloudWatch Logs.
Du kannst auch die Amazon-RDS-Konsole verwenden, um eine DB-Protokolldatei anzuzeigen.
Schnelles Failover bei Aurora PostgreSQL
Um den Betrieb nach einem Failover schnell auf eine fehlerfreie Replikat-Instance umzustellen, konfiguriere die Anwendung für ein schnelles Failover.
Schnelle Wiederherstellung nach einem Failover mit Cluster-Cache-Verwaltung für Aurora PostgreSQL-Compatible
Verwende für eine schnelle Wiederherstellung der DB-Instance im DB-Cluster die Cluster-Cache-Verwaltung für Aurora PostgreSQL-Compatible.
RDS-Proxy zur Verbesserung der Failover-Leistung
Verwende Amazon-RDS-Proxy, um einen offenen Pool von Verbindungen zu den DB-Instances aufrechtzuerhalten. Bei Datenbank-Failovers akzeptiert RDS-Proxy weiterhin Verbindungen mit derselben IP-Adresse und leitet Verbindungen automatisch an die neue primäre DB-Instance weiter. Wenn die ursprüngliche DB-Instance nicht mehr verfügbar ist, stellt RDS-Proxy eine Verbindung zur Standby-Datenbank her, unterbricht jedoch keine inaktiven Anwendungsverbindungen.
Ähnliche Informationen
Hochverfügbarkeit für Amazon Aurora
Überwachung von Metriken in einem Amazon-Aurora-Cluster
Amazon-RDS-Ereigniskategorien und Ereignisnachrichten für Aurora
- Themen
- Database
- Sprache
- Deutsch
