Salta al contenuto

Come posso risolvere i problemi di terminazione di istanze EC2 in Amazon ECS?

3 minuti di lettura
0

Le mie istanze di container Amazon Elastic Container Service (Amazon ECS) eseguite su Amazon Elastic Cloud Compute (Amazon EC2) vengono terminate in modo imprevisto.

Risoluzione

Per identificare la causa della terminazione dell'istanza, esamina gli eventi AWS CloudTrail per la chiamata API TerminateInstances. Nei dettagli dell'evento, annota il valore userAgent per l'utente o il ruolo AWS Identity and Access Management (IAM) che ha invocato l'API. Annota anche i valori SourceIPaddress, eventTime, errorCode e errorMessage.

In base alla causa dei problemi di terminazione dell'istanza, intraprendi le seguenti azioni di risoluzione.

Esamina le metriche per problemi relativi al controllo dell'integrità

Controlla i parametri CPUUtilization e StatusCheckFailed_Instance delle metriche di Amazon CloudWatch per l'istanza terminata. Le anomalie potrebbero mostrare problemi di prestazioni o errori hardware. Per ulteriori informazioni, consulta Controlli dello stato per le istanze Amazon EC2. Se hai attivato CloudWatch Container Insights, controlla anche le metriche di Container Insights.

Controlla i log dell'istanza per capire se l'istanza presenta problemi di connessione di rete, memoria insufficiente o altri problemi sottostanti. L'elevato utilizzo delle risorse può causare problemi di terminazione dell'istanza. Ridimensiona il tipo di istanza di container in base ai requisiti del carico di lavoro.

Controlla la cronologia di Auto Scaling per eventuali problemi

Controlla la cronologia delle attività del gruppo Amazon EC2 Auto Scaling per verificare se un ](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-instances-status-check_sched.html)evento EC2 Auto Scaling pianificato[ ha terminato l'istanza. Se hai avuto un'azione di dimensionamento automatico inaspettata, controlla la configurazione di Auto Scaling, le policy di dimensionamento e le soglie.

Per evitare la terminazione imprevista dell'istanza, utilizza la protezione dalla terminazione gestita per mantenere le istanze di container Amazon ECS che contengono attività in esecuzione.

Per prevenire la terminazione accidentale, puoi anche attivare la protezione dalla terminazione per le istanze. Se hai attivato la protezione dalla terminazione e continui a riscontrare problemi, consulta Come posso risolvere l'errore "L'impostazione di protezione dalla terminazione gestita per il provider di capacità non è valida" in Amazon ECS?

Verifica le interruzioni delle istanze spot

Se utilizzi le istanze spot per il cluster, controlla perché l'istanza spot è stata terminata o interrotta. Determina se Amazon EC2 ha terminato l'istanza spot. Se Amazon EC2 interrompe l'istanza spot, ricevi un avviso 2 minuti prima dell'interruzione.

È consigliabile utilizzare istanze on demand per applicazioni con carichi di lavoro critici che non possono essere interrotti.

Configura i monitoraggi per l'istanza

Crea allarmi CloudWatch per monitorare quando le istanze si arrestano, terminano, si riavviano o si ripristinano automaticamente in modo da identificare proattivamente i problemi. Inoltre, crea un allarme CloudWatch per metriche importanti come CPUUtilization, DiskReadOps, DiskWriteOps, NetworkIn o NetworkOut.

Utilizza Amazon Simple Notification Service (Amazon SNS) e Amazon EventBridge per ricevere avvisi relativi, ad esempio, a modifiche dello stato, come interruzioni, terminazioni e errori nei controlli dell'integrità. Puoi anche creare un avviso che invia un'e-mail quando un'istanza cambia stato.

Per raccogliere le metriche a livello di cluster, istanza, servizio e attività, configura Container Insights.

Configura l'alta disponibilità

Utilizza strategie di posizionamento delle attività, come spread e binpack, in maniera da non concentrare troppe attività su un'istanza.

Inoltre, distribuisci le istanze di container su più zone di disponibilità per ridurre l'effetto della terminazione accidentale di un'istanza. Per ulteriori informazioni, consulta Amazon ECS availability best practices (Best practice sulla disponibilità di Amazon ECS).

AWS UFFICIALEAggiornata 10 mesi fa