Perché la mia istanza di replica AWS DMS è stata riavviata o ha subito un failover?
Desidero risolvere i problemi relativi al riavvio o al failover della mia istanza di replica AWS Database Migration Service (AWS DMS).
Breve descrizione
Un'istanza di replica AWS DMS si riavvia automaticamente per i seguenti motivi:
- Esiste un problema di infrastruttura con l'istanza principale, come la perdita della connettività di rete, un problema con l'unità di calcolo o un problema di archiviazione.
- Il tipo di classe di istanza è cambiato a seguito di un'attività di dimensionamento verticale.
- È in corso una patch software sull'host dell'istanza durante una specifica finestra di manutenzione. Per ulteriori informazioni, consulta Utilizzo delle versioni del motore di replica.
- Hai utilizzato le opzioni Reboot (Riavvio) o Reboot with planned failover (Riavvio con failover pianificato) per eseguire un riavvio manuale dell'istanza.
Quando l'istanza di replica presenta problemi e non risponde ai controlli dell'integrità di AWS DMS, AWS DMS avvia automaticamente un ripristino o un failover. Per le implementazioni single-AZ, AWS DMS avvia un ripristino. Per un'implementazione multi-AZ, AWS DMS avvia un failover. Dopodiché AWS DMS riavvia l'istanza di replica prima che tu possa riprendere manualmente le attività di migrazione del database.
Risoluzione
Esamina gli eventi di AWS DMS per identificare la causa principale
Per identificare la causa del riavvio o del failover dell'istanza, visualizza gli eventi di AWS DMS delle ultime 24 ore. Apri la console AWS DMS e scegli Events (Eventi).
Nota: per impostazione predefinita, AWS DMS registra gli eventi nel fuso orario UTC.
Per archiviare eventi per un lungo periodo, invia gli eventi di AWS DMS ad Amazon EventBridge. Per ulteriori informazioni, consulta Implement an automated approach for handling AWS DMS operational events (Come implementare un approccio automatizzato per la gestione degli eventi operativi di AWS DMS).
Se ricevi il messaggio di evento Replication instance patched, ciò significa che è stato effettuato un aggiornamento della versione del motore all'istanza di replica. L'aggiornamento può avvenire immediatamente dopo la modifica dell'istanza o durante una finestra di manutenzione programmata.
Se il tipo di classe di istanza cambia, ricevi il messaggio di evento The replication instance class for this replication instance is being changed o The replication instance class for this replication instance has changed. Le implementazioni single-AZ non sono disponibili per alcuni minuti durante un'operazione di dimensionamento. Le implementazioni multi-AZ non sono disponibili per la durata del failover. Il failover dura in genere 60 secondi. AWS DMS aggiorna il database in standby prima del failover del database ridimensionato.
Potresti ricevere i messaggi di evento Multi-AZ instance failover started o Multi-AZ instance failover completed per i seguenti motivi:
- L'istanza di replica principale non risponde.
- L'istanza è stata riavviata manualmente con le opzioni Reboot (Riavvio) o Reboot with planned failover (Riavvio con failover pianificato).
- L'istanza di replica presenta problemi di rete intermittenti con l'host sottostante.
Monitora le metriche di AWS DMS con la dashboard di monitoraggio avanzato
AWS DMS fornisce le metriche dalla dashboard di monitoraggio avanzato ad Amazon CloudWatch Logs. Visualizza il log delle istanze di replica per le metriche relative a prestazioni, utilizzo delle risorse e integrità.
Nota: le repliche di AWS DMS serverless non supportano il monitoraggio avanzato.
Attiva le implementazioni multi-AZ per ridurre i tempi di inattività
Per ridurre i tempi di inattività, attiva le implementazioni multi-AZ. In un'implementazione multi-AZ, una replica in standby dell'istanza di replica è disponibile in una zona di disponibilità diversa. Per ulteriori informazioni, consulta Resilienza in AWS Database Migration Service.
Nota: per le istanze che utilizzano Amazon Simple Storage Service (Amazon S3) come destinazione, AWS DMS potrebbe scrivere record duplicati nel bucket S3. Ciò si verifica quando riprendi l'attività dopo un riavvio o un failover e TargetTablePrepMode è impostato su DO_NOTHING.
Informazioni correlate
- Argomenti
- Migration & Modernization
- Lingua
- Italiano
