Je souhaite résoudre les erreurs « 503 Service Unavailable » que je reçois lorsque j'utilise des ressources à la demande Amazon Bedrock. Je n'ai pas dépassé les quotas de compte AWS.
Résolution
Remarque : Si des erreurs surviennent lorsque vous exécutez des commandes de l'interface de la ligne de commande AWS (AWS CLI), consultez la section Résoudre des erreurs liées à l’AWS CLI. Vérifiez également que vous utilisez bien la version la plus récente de l'interface.
Vous recevez le message d’erreur 503 Service Unavailable pour les exceptions côté serveur qui se produisent lorsque le serveur ne peut pas répondre en raison de défaillances. Ou bien, l'erreur se produit lorsqu'une augmentation du nombre de requêtes met à rude épreuve les ressources partagées. Pour identifier la cause de l'erreur, effectuez les actions suivantes.
Vérifier l'état du service
Si vous ne pouvez pas accéder à Amazon Bedrock, vérifiez la disponibilité du service. Vérifiez l'état du service sur le tableau de bord AWS Health pour vérifier s'il existe des problèmes persistants avec Amazon Bedrock dans votre région AWS.
Réessayer la requête
Pour vérifier si l'erreur est due à une augmentation temporaire de la demande d'API, utilisez un backoff exponentiel pour réessayer la requête. Cette méthode réduit la charge sur le serveur et améliore les chances de réussite de la requête.
Les kits SDK AWS intègrent souvent une logique de nouvelle tentative. Configurez le comportement de nouvelle tentative pour votre kit SDK AWS en fonction de vos besoins.
Utiliser une autre région
Pour vérifier si l'augmentation de la requête ou les défaillances sont spécifiques à une région, mettez à jour vos ressources pour utiliser une autre région. Lorsque vous passez à une autre région, accordez l'accès au modèle pour Amazon Bedrock dans cette région.
Si vous utilisez des kits SDK AWS, vérifiez la compatibilité régionale de votre kit SDK AWS. Pour mettre à jour votre kit SDK AWS afin d'utiliser une autre région, exécutez la commande set de l’AWS CLI suivante :
aws configure set region new-region-name
Remarque : Remplacez new-region-name par la nouvelle région.
Utiliser l'inférence interrégionale pour utiliser automatiquement la capacité de plusieurs régions
Utilisez l'inférence interrégionale pour gérer de manière fluide les rafales de trafic imprévues. L'inférence interrégionale achemine de façon dynamique les requêtes vers les régions dotées de capacités. Cela permet à vos charges de travail d'évoluer en fonction de la demande.
Utiliser d'autres modèles de fondation
Si la requête augmente ou si des défaillances surviennent sur un modèle de base spécifique, utilisez un autre modèle de base.
Remarque : Les paramètres requis sont différents pour chaque modèle de fondation. L'API Converse fonctionne avec tous les modèles Amazon Bedrock qui prennent en charge les messages. Elle vous permet d'écrire du code une seule fois et de l'utiliser avec différents modèles.
Utiliser le débit provisionné
Prérequis : Assurez-vous que vous vous trouvez dans une région prise en charge pour le débit provisionné.
Analysez les modèles d'utilisation et les exigences de pointe de votre application. Si vous devez fournir un débit plus élevé, utilisez le débit provisionné. Pour utiliser l'interface de ligne de commande AWS ou le kit SDK AWS pour Python (Boto3) afin d'utiliser le débit provisionné, consultez la section Exemples de code pour le débit provisionné.