如何对处于“降级”或“严重”状态的 Elastic Beanstalk 环境进行故障排除?

2 分钟阅读
0

我想对处于“降级”或“严重”状态的 AWS Elastic Beanstalk 环境进行故障排除。

解决方法

运行 AWSSupport-TroubleshootElasticBeanstalk 运行手册

**注意:**在启动运行手册之前,请确保您的 AWS Identity and Access Management (IAM) 用户或角色具有所需的权限。有关详细信息,请参阅 AWSSupport-TroubleshootElasticBeanstalk 中的“所需的 IAM 权限”。

完成以下步骤:

  1. 打开 AWS Systems Manager 控制台
  2. Regions(区域)列表中,选择您的 AWS 区域。
  3. 在导航窗格中,展开 Shared Resources(共享资源),然后选择 Documents(文档)。
  4. 在搜索栏中,输入 AWSSupport-TroubleshootElasticBeanstalk,然后选择该运行手册。
  5. 选择 Execute automation(执行自动化)。
  6. 对于输入参数,输入以下内容:
    (可选)**AutomationAssumeRole。**输入允许自动化执行操作的 IAM 角色的 Amazon Resource Network (ARN)。如果未指定角色,自动化将使用启动运行手册的用户的权限。
    **ApplicationName。**输入您的 Elastic Beanstalk 应用程序的名称。
    **EnvironmentName。**输入您的 Elastic Beanstalk 环境的名称。
    (可选)**AWSS3UploaderLink。**AWS Support 为您提供了一个 URL,用于从 Elastic Beanstalk 环境上传日志包。此选项仅适用于已购买 AWS Support 计划并已提交支持案例的客户。
  7. 选择 Execute(执行)。有关运行手册执行的操作列表,请参阅 AWSSupport-TroubleshootElasticBeanstalk 中的“文档步骤”。
  8. 检查自动化执行的每项操作的详细信息以及检测到的问题。

**注意:**为了帮助您进一步对 AWS 资源进行故障排除、管理并降低 AWS 资源的成本,请使用 AWS Support 为 AWS Systems Manager 提供的预定义运行手册。这些运行手册具有 AWSSupportAWSPremiumSupport 前缀。有关详细信息,请参阅 Systems Manager Automation 运行手册参考

手动对您的 Elastic Beanstalk 环境进行故障排除

以下常见问题可能会导致 Elastic Beanstalk 环境出现黄色或红色运行状况警告。有关警告的详细信息,请参阅 Health colors and statuses

确定出现运行状况警告的原因

完成以下步骤:

  1. 打开 Elastic Beanstalk 控制台
  2. 选择应用程序。
  3. 在导航窗格中,选择 Events(事件)。
  4. Type(类型)列中,查找 Severity(严重性)类型为 WARN(警告)的近期事件,然后记下这些事件以便稍后对其进行故障排除。
  5. 在导航窗格中,选择 Dashboard(控制面板)。
  6. 运行状况部分中,选择原因

现在,您可以在增强型运行状况概述页面上查看环境的整体运行状况。有关详细信息,请参阅 Enhanced health monitoring with the environment management console

对已确定的运行状况警告原因进行故障排除

根据您在 Enhanced Health Overview(增强型运行状况概述)页面中确定的运行状况问题,选择以下方法之一进行故障排除:

  • 如果是负载均衡器运行状况检查失败,请参阅如何对 Elastic Beanstalk 的弹性负载均衡运行状况检查进行故障排除?
  • 如果是其他运行状况检查失败,请参阅基本运行状况报告。有关增强型运行状况报告,请参阅 Elastic Beanstalk 增强型运行状况报告和监控
  • 如果是操作耗时过长,请识别正在进行的使用 Elastic Beanstalk 事件流的操作。或者,登录您的 Amazon EC2 实例以监控 /var/log/eb-engine.log
    **注意:**比通常操作花费时间更长的操作通常是环境部署或配置更新。
  • 如果是 4xx 和 5xx HTTP 返回码数量增加,请监控代理服务器的访问日志以确定原因。然后,将访问日志与应用程序日志进行比较,以确定错误增加的模式。有关详细信息,请参阅常见错误
    注意:代理服务器日志可以是 Apache (/var/log/httpd/access_log)、NGINX (/var/log/nginx/access_log) 或 Internet Information Services (C:\inetpub\logs\LogFiles) 的访问日志,具体取决于您的设置。
  • 如果是实例处于严重状态,请根据发出的警告选择解决方案。有关详细信息,请参阅对 Amazon EC2 实例的问题进行故障排除
    注意:由于持续部署、Amazon EC2 实例运行状况进程守护程序失败或资源利用率高,您的实例可能会处于严重状态。环境中的警告状态是暂时的,在您解决了导致问题的原因后会变为绿色。有关详细信息,请参阅 Health colors and statuses
  • 如果是 Elastic Beanstalk 运行状况进程守护程序失败,请登录您的 Amazon EC2 实例并监控 /var/log/messages/var/log/healthd/daemon.log 以确定原因。
    注意: 如果您看到以下消息:“None of the instances are sending data”(所有实例均未发送数据),请参阅我如何解决 EC2 实例无法与 Elastic Beanstalk 通信时收到的错误?

相关信息

运行由 Systems Manager Automation 提供支持的自动操作

设置自动化

AWS 官方
AWS 官方已更新 3 个月前