我想在我的 Amazon Elastic Compute Cloud (Amazon EC2) 实例未通过状态检查时启动自动恢复操作。
简短描述
自动恢复可以在 EC2 实例未通过系统状态检查时恢复该实例。实例在系统状态检查期间失败通常意味着 AWS 硬件存在问题。但是,自动恢复无法恢复未通过实例状态检查的实例。有关这些检查的详细信息,请参阅状态检查类型。
**注意:**只有某些实例类型支持自动恢复操作。
解决方法
要自动恢复实例,请使用以下方法之一:
- 基于实例配置的简化的自动恢复
- Amazon CloudWatch 基于操作的恢复
基于实例配置的简化的自动恢复
默认情况下,所有支持简化的自动恢复的实例均配置为恢复失败的实例。
确保遵循简化的自动恢复先决条件。您可以在实例启动期间或启动实例之后执行以下操作。
要在实例启动期间关闭简化的自动恢复,请完成以下步骤:
- 打开 Amazon EC2 控制台。
- 选择 Launch instance(启动实例)。
- 在 Advanced details(高级详细信息)下,关闭 Instance auto-recovery(实例自动恢复)。
- 配置您的设置,然后启动实例。
要将处于 Running(正在运行)或 Stopped(已停止)状态的实例的自动恢复行为设置为默认值,请完成以下步骤:
- 打开 Amazon EC2 控制台。
- 在导航窗格中,选择 Instances(实例)。
- 选择实例,然后选择 Actions(操作)。
- 选择 Instance settings(实例设置),然后在 Change auto-recovery behavior(更改自动恢复行为)中选择 Default (On)(默认值(开启))。
**注意:**要关闭自动恢复,请关闭 Change auto-recovery behavior(更改自动恢复行为)。
- 选择 Save(保存)。
要查看简化的自动恢复的结果,请查看 AWS Health Dashboard 事件。通知示例:
- 失败的事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
- 成功的事件: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
CloudWatch 基于操作的恢复
使用 CloudWatch 基于操作的恢复可选择何时恢复实例。当事件调用 StatusCheckFailed_System 警报时,CloudWatch 会启动恢复操作。然后,Amazon Simple Notification Service (Amazon SNS) 主题将启动您在创建警报时选择的通知。
**重要事项:**作为实例恢复的一部分,Amazon EC2 会在实例重启期间迁移实例,且内存中的数据将丢失。
实例恢复过程完成后,CloudWatch 会向 SNS 主题发布信息。SNS 主题的订阅者会收到一封电子邮件通知,其中包括恢复尝试的状态以及进一步的指示。成功恢复表现为实例在已恢复的实例上重启。
验证您的配置是否符合 CloudWatch 基于操作的恢复要求。要在实例上配置自动恢复,请为恢复操作配置 CloudWatch 警报。