Amazon Bedrock のバッチ推論ジョブが低速になったり、失敗したりします。
バッチジョブの実行時間は、使用可能な容量、キュー内の並行ジョブ、モデル固有のリソース割り当てに応じて変化します。Amazon Bedrock のバッチ推論ジョブを最適化するには、次の解決方法を実施します
ジョブの処理時間を短縮し、結果の質を改善するには、不必要なコンテキストを含めずに、明確で簡潔なプロンプトを作成します。
複数のバッチ推論ジョブを並行して実行する場合は、モデルや AWS リージョンに固有のサービスクォータを超えないようにしてください。
大規模プロジェクトの詳細については、「Amazon Bedrock バッチ推論の自動化: スケーラブルで効率的なパイプラインを作成する」を参照してください。
Amazon EventBridge を使用し、リソースの可用性が向上する可能性があるオフピーク時にバッチ推論ジョブをスケジュールします。
CreateModelInvocationJob API リクエストでクロスリージョン推論プロファイルを使用すると、複数リージョンにワークロードを分散できます。