Amazon SageMaker での "ResourceLimitExceeded" エラーをトラブルシューティングしたいです。
解決策
SageMaker リソースを作成する際に、ResourceLimitExceeded エラーが発生する場合があります。これらのリソースには、SageMaker のトレーニングジョブ、処理ジョブ、ホスティング用エンドポイント、または Studio アプリが含まれます。既存のリソースのインスタンス構成を変更したときにも、このエラーが発生する場合があります。
エラーの例:
"アカウントレベルのサービス制限 'ml.m5.xlarge for endpoint usage' は 0 インスタンスす。現在の使用率は 0 インスタンスであり、リクエスト差分は 1 インスタンスです。AWS サポートに連絡して、この制限の増加をリクエストしてください。"
SageMaker リソースに指定されている AWS アカウントレベルのサービスクォータを超えると、このエラーが発生します。すべてのクォータは、お使いのアカウント、AWS リージョン、使用タイプに固有であることに注意してください。このエラーを解決するには、次の手順を実行します。
- Service Quotas コンソールを開きます。
注: Service Quotas コンソールを使用するには、ユーザーまたはロールに対応する AWS Identity and Access Management (IAM) アクセス許可が必要です。
- ナビゲーションペインで [AWS サービス] を選択します。
- 検索バーに Amazon SageMaker と入力します。次に、[Amazon SageMaker] を選択します。
- 増やす対象のクォータを選択します。エラーメッセージの例では、エンドポイントの使用方法に ml.m5.xlarge を選択します。
- [アカウントレベルで引き上げをリクエスト] を選択します。
- [クォータ値を増やす] に目的の値を入力します。
- [リクエスト] を選択します。
これにより、リクエストが AWS サポートに送信されます。ユースケースと現在の使用状況に基づいて、AWS サポートはリクエストを承認または拒否するか、部分的に承認します。
関連情報
AWS のサービスクォータ
SageMaker のサービスクォータ
CreateTrainingJob
InstanceGroup