我想解决我在尝试启动以下 Amazon SageMaker AI 资源之一时收到的“InsufficientCapacity”错误:训练作业、批量转换作业、处理作业、端点、Notebook 实例或 SageMaker Studio 应用程序。
解决方法
当 AWS 没有足够的按需容量来完成您的请求时,您可能会收到类似于以下错误消息的 InsufficientCapacity 错误:
“由于 InsufficientInstanceCapacity 错误,无法预置请求的 ML 计算容量。请使用其他 ML 实例类型或在一段时间后重试。”
“调用 StartInstances 操作时出现错误 (InsufficientInstanceCapacity)(达到重试次数上限: 4): 容量不足。”
Amazon Elastic Compute Cloud (Amazon EC2) 实例容量不是静态的。实例容量取决于特定 AWS 区域或可用区中的工作负载。容量不足错误与 AWS 应用于您的 AWS 账户的资源配额无关。
容量问题是暂时性的,当您再次尝试请求时可能会得到解决。如果您可以延迟请求,请稍后再尝试您的请求。
要立即访问实例,请执行以下操作之一:
- 切换到相同系列、不同实例类型中的更大实例大小,或根据您的工作负载使用不同的实例系列。
- 在不同的区域或可用区启动相同实例类型的资源,因为每种实例类型都有自己的容量。验证每个区域都有哪些 SageMaker AI 实例类型可用。
**注意:**要查看实例类型的可用性,请在 On-demand pricing(按需定价)页面上,选择与您的 SageMaker AI 功能对应的选项卡。然后,从 Region(区域)下拉列表中选择您的区域。
- 提交减少实例数量的新实例请求。
- 要为任务关键型工作负载预留实例,请使用按需容量预留。要创建容量预留,请联系您的 AWS 账户经理。
如果您启动 SageMaker Studio 应用程序,请为该应用程序配置跨多个可用区的子网,以最大限度地减少容量问题。
如果您启动 Notebook 实例或训练作业,请选择在不同可用区中有多个子网的相同实例类型。
相关信息
实例容量不足
支持的区域和配额