使用自动化工作流 SAW 诊断 AWS 环境中的常见问题

2 分的閱讀內容
內容層級:基礎
1

在您的 AWS 环境中手动排查和解决系统问题可能会是重复性和容易出错的。AWS 技术支援团队引入了自动化工作流(SAW),这是一个强大的功能,可让 AWS 客户进行自助式诊断和修复。利用AWS System Manager, SAW 提供了一个用户友好的收藏集,包含经过严格挑选的自动化手册,简化了故障排查过程并提供了解决步骤。手册使您能够快速解决连接问题、诊断权限错误、重置 Amazon EC2 访问等等。自动化手册(以 AWSSupport 或 AWSPremiumSupport 为前缀)适用于一系列 AWS 服务,包括但不限于 Amazon EC2、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic Kubernetes Service (EKS)、Amazon Elastic Container Service (ECS)等。

在本文中,您将探索如何使用自动化工作流自动排查,以诊断 AWS 环境中的常见问题,而无需联系 AWS 支援。SAW 手册提供的简化故障排查能够更快地找到根本原因并修复系统问题。

什么是自动化工作流(SAW)

在学习自动化工作流(SAW)之前,我们需要了解什么是 AWS System Manager ,因为它是SAW的基础。AWS Systems Manager 是您AWS应用程序和资源的运营中心,是一个安全的端到端管理解决方案。支援自动化工作流 (SAW) 是建立在 AWS Systems Manager自动化服务之上的自动化手册。这些手册可帮助您排查 AWS 资源的常见问题、主动监控和识别网路问题、收集和分析日志等。

Enter image description here

增强您在 AWS 环境中的故障排查和诊断技术

AWS Support 自动化工作流 (SAW) 代表了亚马逊的核心理念 - 客户至上。AWS SAW的起源植根于客户体验。当客户联系 AWS 支援时,我们的工程师会解决问题并记录下来。我们观察到了反复出现的问题,以及改善客户体验的潜力。基于这些洞察,我们构建了定制工具,以更好地支援我们的客户。AWS SAW 利用我们多年来积累的经验、最佳实践和经验教训,消除了重复性、耗时和手动的客户任务,使其成为解决各种故障排查问题的强大工具。一些可以从中受益的用例包括;排查SSH连接问题、分析EC2磁盘使用情况、诊断Amazon S3问题、以及在Amazon EKS或Amazon ECS环境中收集关键日志。这些手册在EC2实例无法通过SSH访问或实例位于私有子网中但启用了AWS System Manager VPC 端点的情况下特别有用。您还可能发现其他用例。

• 诊断、故障排查和提供修复:使用 AWSPremiumSupport-TroubleshootEC2DiskUsage 调查并可能修复Amazon EC2实例磁盘使用问题,甚至自动在操作系统(OS)级别扩展卷、分区和文件系统。

• 实现自动管理分析和配置更新:使用 AWSSupport-EnableVPCFlowLogs 为您 AWS 帐户中的多个子网、网络界面和VPC配置 Amazon VPC Flow Logs

• 成本优化和运营审查:使用 AWSPremiumSupport-PostgreSQLWorkloadReview 捕获 Amazon Relational Database Service (Amazon RDS) PostgreSQL数据库使用统计的多个快照。

• 出于诊断目的收集日志:例如,您可以利用 AWSSupport-CollectEKSInstanceLogs 从 Amazon Elastic Kubernetes Service (Amazon EKS) 收集操作系统级别的日志文件,以排查集群问题。 要查看其他可以帮助处理各种用例的手册,请务必访问AWS支援支援自动化工作流(SAW)登录页,您将找到一个有帮助的列表。讓我們看看如何使用 SAW 來簡化手動過程,節省您的時間和精力。

開始使用支援自動化工作流

前提條件 您需要以下條件才能繼續使用AWS SAW:

• 一個AWS帳戶

• 確保您操作的 IAM 用戶或 IAM 角色具有最低所需的 IAM 權限來訪問 System Manager控制台

• 有足夠的IAM權限來啟動手冊。有時策略可能會有所不同,取決於手冊,但需要:

 - ssm:StartAutomationExecution
 - ssm:GetAutomationExecution
 - ssm:SendCommand

• 如果您想访问前缀为AWSPremiumSupport的手册,请确保您已订阅AWS商业或企业支援计划

• 对于一些手册对您的 EC2 实例采取行动,您必须安装 AWS Systems Manager 代理程序(SSM代理程序),并通过附加 AmazonSSMManagedInstanceCore AWS 托管策略来授予权限,该策略对应于您的 EC2 实例配置文件。

要使用 AWS Support 自动化工作流 (SAW) 手册,请导航到 AWS Systems Manager 控制台,选择您打算使用的 AWS 区域。在 Systems Manager 控制台中,在左侧导航选单的共享资源部分查找“文件”。在这里,您可以看到所有 Amazon 提供的 AWS Systems Manager 文件。通过搜索关键字,将文件名前缀等于 AWSSupport,您将找到 AWS Support 管理的 SAW 手册。

Enter image description here

让我们从 AWSSupport-ListEC2Resources 手册开始。此文件可协助您列出您 AWS 帐户中的 EC2 相关资源,如 EC2 实例、弹性 IP、EBS 磁碟区和自动扩展群组。要执行此手册,请选择执行自动化:

Enter image description here

在点击状态后,您可以查看详细信息,或者导航到自动化页面,查看执行结果的输出:

Enter image description here

如果您想使用 AWS CLI 来启动一个手册,您可以使用 "aws ssm start-automation-execution" 命令来实现。以下是一个列出所有 AWS 区域中 EC2 资源的示例:

aws ssm start-automation-execution --document-name "AWSSupport-ListEC2Resources" --parameters '{"RegionsToQuery":["All"]}'

輸出:

{
    "AutomationExecutionId": "6053b7c6-7ec7-4b9b-b52c-04ddd912ede1"
}

要檢索自動化的狀態,請運行以下命令並使用自動化執行 ID:

aws ssm describe-automation-executions --filter "Key=ExecutionId,Values=6053b7c6-7ec7-4b9b-b52c-04ddd912ede1"

輸出:

{
    "AutomationExecutionMetadataList": [
        {
            "AutomationExecutionId": "6053b7c6-7ec7-4b9b-b52c-04ddd912ede1",
            "DocumentName": "AWSSupport-ListEC2Resources",
            "DocumentVersion": "7",
            "AutomationExecutionStatus": "InProgress",
            "ExecutionStartTime": "2024-03-13T09:53:45.685000+00:00",
            "ExecutedBy": "arn:aws:sts::123456789012:assumed-role/Administrator/Admin",
            "LogFile": "",
            "Outputs": {},
            "Mode": "Auto",
            "CurrentStepName": "listVolumes",
            "CurrentAction": "aws:executeScript",
            "Targets": [],
            "ResolvedTargets": {
                "ParameterValues": [],
                "Truncated": false
            },
            "AutomationType": "Local"
        }
    ]
}


了解更多关于支持自动化工作流 SAW 的信息

在这篇文章中,我们介绍了几种支持自动化工作流程的用例,并了解它如何增强您的故障排查过程。AWS Support 不断创新故障排查技术,致力于提供更好的支持体验。对于那些还未探索 AWS SAW 潜力的人,我们邀请您今天就尝试一下。

profile pictureAWS
專家
已發佈 2 個月前檢視次數 1410 次