Pourquoi mon instance EC2 Linux a-t-elle redémarré toute seule ?

Lecture de 4 minute(s)
0

Pourquoi mon instance Linux Amazon Elastic Compute Cloud (Amazon EC2) a-t-elle redémarré de manière inattendue ?

Brève description

Bien que les redémarrages inattendus soient rares, plusieurs raisons peuvent en être à l'origine. Les raisons les plus courantes sont les suivantes :

  • L'instance a échoué à l'un de ses contrôles d'état ou aux deux.
  • Le matériel sous-jacent hébergeant votre instance était défectueux et Amazon EC2 a redémarré l'instance pour la déplacer vers un nouveau matériel en bon état.
  • Une maintenance planifiée a eu lieu sur votre instance et a nécessité un redémarrage.
  • Un utilisateur ou une application de votre serveur a redémarré l'instance.
  • Il y a eu un bug dans le noyau. En cas de bug dans le noyau, assurez-vous que celui-ci est totalement à jour.
    Pour mettre à jour le noyau, exécutez l'une des commandes suivantes ou une commande similaire, en fonction de votre système d'exploitation Linux (OS) et de sa version :
    • sudo yum update kernel
    • sudo zypper up kernel-default
    • sudo apt upgrade linux-image-aws

Résolution

Vous pouvez effectuer plusieurs actions pour déterminer pourquoi votre instance a redémarré :

Afficher les vérifications de l’état

Examinez les vérifications de l'état de l'instance à partir de la console ou en utilisant l'interface de la ligne de commande AWS (AWS CLI). Si un échec de vérification de l’état est indiqué, reportez-vous à la section Pourquoi mon instance Linux EC2 est-elle inaccessible et échoue-t-elle à l'un de ses contrôles d'état ou aux deux ?

Remarque : si vous recevez des messages d’erreurs lors de l'exécution des commandes de l'AWS CLI, assurez-vous que vous utilisez la version la plus récente de l'AWS CLI.

Afficher les journaux du système

Si l'instance n'a pas échoué à une vérification de l'état, il est possible qu'elle ait redémarré en raison de problèmes au niveau du système d'exploitation. Examinez les journaux du système pour déterminer l'erreur qui s'est produite. Les journaux système se trouvent dans /var/log/messages ou /var/log/syslog en fonction de la distribution de votre système d'exploitation.

Si la vérification de l'état de l'instance échoue, vous pouvez la redémarrer pour récupérer les journaux système à l'aide de la sortie de la console. Examinez les journaux de sortie de la console pour résoudre votre problème. Pour en savoir plus, reportez-vous à la section Récupérer les journaux système.

  1. Ouvrez la console Amazon EC2.
  2. Sélectionnez Instances, puis choisissez votre instance.
  3. Choisissez État de l'instance, puis Redémarrer l'instance. Le redémarrage de votre instance peut prendre quelques minutes.
  4. Vérifiez si le problème persiste. Dans certains cas, le redémarrage peut résoudre le problème.
  5. Lorsque l'instance est en cours d'exécution; choisissez Actions, Surveiller et résoudre les problèmes, Obtenir le journal système.
  6. Examinez le journal qui s'affiche à l'écran. Trouvez l'erreur répertoriée dans le journal dans Résoudre les erreurs du journal système pour les instances basées sur Linux pour obtenir des informations de résolution.

Afficher l'historique des redémarrages

Utilisez les commandes suivantes pour déterminer si un utilisateur ou une application du serveur a initié le redémarrage :

# grep reboot /home/*/.bash_history
# grep reboot /root/.bash_history
# history | grep -i reboot
# history | grep -i init
# last reboot

Afficher l'historique des événements AWS CloudTrail

Les redémarrages d'instances initiés depuis la console Amazon EC2 ou à travers l'AWS CLI apparaissent dans l'historique des événements CloudTrail. Pour examiner ces événements, procédez comme suit :

  1. Ouvrez la console AWS CloudTrail.
  2. Choisissez Historique des événements.
  3. Sélectionnez le nom de l'événement dans la liste déroulante des filtres, puis entrez RebootInstances.

Remarque : vous pouvez créer une alarme Amazon CloudWatch qui rétablit automatiquement les instances présentant des problèmes matériels sous-jacents entraînant un redémarrage. Pour en savoir plus sur la configuration de l'alarme CloudWatch, reportez vous à la section Restaurer votre instance.

Informations connexes

Résoudre les problèmes des instances dont les vérifications de l'état ont échoué

Types de vérifications de l'état

AWS OFFICIEL
AWS OFFICIELA mis à jour il y a 2 ans