跳至内容

如何解决启动 SageMaker AI 资源时出现的容量不足错误?

1 分钟阅读
0

我想解决我在尝试启动以下 Amazon SageMaker AI 资源之一时收到的“InsufficientCapacity”错误:训练作业、批量转换作业、处理作业、端点、Notebook 实例或 SageMaker Studio 应用程序。

解决方法

当 AWS 没有足够的按需容量来完成您的请求时,您可能会收到类似于以下错误消息的 InsufficientCapacity 错误:

“由于 InsufficientInstanceCapacity 错误,无法预置请求的 ML 计算容量。请使用其他 ML 实例类型或在一段时间后重试。”

“调用 StartInstances 操作时出现错误 (InsufficientInstanceCapacity)(达到重试次数上限: 4): 容量不足。”

Amazon Elastic Compute Cloud (Amazon EC2) 实例容量不是静态的。实例容量取决于特定 AWS 区域或可用区中的工作负载。容量不足错误与 AWS 应用于您的 AWS 账户的资源配额无关。

容量问题是暂时性的,当您再次尝试请求时可能会得到解决。如果您可以延迟请求,请稍后再尝试您的请求。

要立即访问实例,请执行以下操作之一:

  • 切换到相同系列、不同实例类型中的更大实例大小,或根据您的工作负载使用不同的实例系列。
  • 在不同的区域或可用区启动相同实例类型的资源,因为每种实例类型都有自己的容量。验证每个区域都有哪些 SageMaker AI 实例类型可用。
    **注意:**要查看实例类型的可用性,请在 On-demand pricing(按需定价)页面上,选择与您的 SageMaker AI 功能对应的选项卡。然后,从 Region(区域)下拉列表中选择您的区域。
  • 提交减少实例数量的新实例请求。
  • 要为任务关键型工作负载预留实例,请使用按需容量预留。要创建容量预留,请联系您的 AWS 账户经理。

如果您启动 SageMaker Studio 应用程序,请为该应用程序配置跨多个可用区的子网,以最大限度地减少容量问题。

如果您启动 Notebook 实例或训练作业,请选择在不同可用区中有多个子网的相同实例类型。

相关信息

实例容量不足

支持的区域和配额

AWS 官方已更新 2 个月前