Amazon SageMaker AI リソース (トレーニングジョブ、バッチ変換ジョブ、処理ジョブ、エンドポイント、ノートブックインスタンス、SageMaker Studio アプリ) の起動を試みると "InsufficientCapacity" エラーが発生するため、トラブルシューティングしたいと考えています。
解決策
AWS でリクエストを完了するのに十分なオンデマンド容量が不足している場合は、次のエラーメッセージに類似した InsufficientCapacity エラーが発生することがあります。
「Unable to provision requested ML compute capacity due to InsufficientInstanceCapacity error.Please retry using a different ML instance type or after some time」 (インスタンス容量が不足しているため、要求された ML コンピューティング容量をプロビジョニングできません。別の ML インスタンスタイプを使用するか、しばらくしてから再試行してください)
「An error occurred (InsufficientInstanceCapacity) when calling the StartInstances operation (reached max retries: 4): Insufficient capacity」
Amazon Elastic Compute Cloud (Amazon EC2) インスタンスのキャパシティは静的ではありません。インスタンスのキャパシティは、特定の AWS リージョンまたはアベイラビリティーゾーンのワークロードに左右されます。キャパシティ不足エラーは、AWS が AWS アカウントに適用するリソースクォータとは関連していません。
キャパシティの問題は一時的なもので、リクエストを再試行すると解決する場合があります。リクエストを遅延させても問題ない場合は、後でリクエストを試してください。
インスタンスにすぐにアクセスするには、次のいずれかの手順を実行します。
- ワークロードに応じて、同じファミリーの大きいインスタンスサイズに切り替えるか、別のインスタンスタイプに切り替えるか、別のインスタンスファミリーを使用します。
- キャパシティはインスタンスタイプによって異なるため、同じインスタンスタイプの別のリージョンまたはアベイラビリティーゾーン内でリソースを起動します。各リージョンで使用可能な SageMaker AI インスタンスタイプを確認します。
注: インスタンスタイプの可用性を確認するには、[オンデマンド料金] ページから、目的の SageMaker AI 機能に関連するタブを選択します。次に、[リージョン] ドロップダウンリストでリージョンを選択します。
- インスタンス数を減らして新しいインスタンスリクエストを送信します。
- ミッションクリティカルなワークロード用にインスタンスを予約するには、オンデマンドのキャパシティ予約を使用します。キャパシティ予約の作成については、AWS アカウントマネージャーにご相談ください。
SageMaker Studio アプリを起動する場合は、複数のアベイラビリティーゾーンにわたる複数のサブネットを持つアプリを構成することで、容量の問題を最小化します。
ノートブックインスタンスまたはトレーニングジョブを起動する場合は、別々のアベイラビリティーゾーンで複数のサブネットを持つ同じインスタンスタイプを選択します。
関連情報
インスタンスのキャパシティ不足
サポートされるリージョンとクォータ