跳至内容

如何在 Amazon EC2 实例未通过状态检查时启动自动恢复?

1 分钟阅读
0

我想在我的 Amazon Elastic Compute Cloud (Amazon EC2) 实例未通过状态检查时启动自动恢复操作。

简短描述

自动恢复可以在 EC2 实例未通过系统状态检查时恢复该实例。实例在系统状态检查期间失败通常意味着 AWS 硬件存在问题。但是,自动恢复无法恢复未通过实例状态检查的实例。有关这些检查的详细信息,请参阅状态检查类型

**注意:**只有某些实例类型支持自动恢复操作。

解决方法

要自动恢复实例,请使用以下方法之一:

  • 基于实例配置的简化的自动恢复
  • Amazon CloudWatch 基于操作的恢复

基于实例配置的简化的自动恢复

默认情况下,所有支持简化的自动恢复的实例均配置为恢复失败的实例。

确保遵循简化的自动恢复先决条件。您可以在实例启动期间或启动实例之后执行以下操作。

要在实例启动期间关闭简化的自动恢复,请完成以下步骤:

  1. 打开 Amazon EC2 控制台
  2. 选择 Launch instance(启动实例)。
  3. Advanced details(高级详细信息)下,关闭 Instance auto-recovery(实例自动恢复)。
  4. 配置您的设置,然后启动实例。

要将处于 Running(正在运行)或 Stopped(已停止)状态的实例的自动恢复行为设置为默认值,请完成以下步骤:

  1. 打开 Amazon EC2 控制台
  2. 在导航窗格中,选择 Instances(实例)。
  3. 选择实例,然后选择 Actions(操作)。
  4. 选择 Instance settings(实例设置),然后在 Change auto-recovery behavior(更改自动恢复行为)中选择 Default (On)(默认值(开启))。
    **注意:**要关闭自动恢复,请关闭 Change auto-recovery behavior(更改自动恢复行为)。
  5. 选择 Save(保存)。

要查看简化的自动恢复的结果,请查看 AWS Health Dashboard 事件。通知示例:

  • 失败的事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
  • 成功的事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

CloudWatch 基于操作的恢复

使用 CloudWatch 基于操作的恢复可选择何时恢复实例。当事件调用 StatusCheckFailed_System 警报时,CloudWatch 会启动恢复操作。然后,Amazon Simple Notification Service (Amazon SNS) 主题将启动您在创建警报时选择的通知。

**重要事项:**作为实例恢复的一部分,Amazon EC2 会在实例重启期间迁移实例,且内存中的数据将丢失。

实例恢复过程完成后,CloudWatch 会向 SNS 主题发布信息。SNS 主题的订阅者会收到一封电子邮件通知,其中包括恢复尝试的状态以及进一步的指示。成功恢复表现为实例在已恢复的实例上重启。

验证您的配置是否符合 CloudWatch 基于操作的恢复要求。要在实例上配置自动恢复,请为恢复操作配置 CloudWatch 警报

AWS 官方已更新 1 年前