Passer au contenu

Comment résoudre les problèmes courants liés à SageMaker AI JumpStart ?

Lecture de 4 minute(s)
0

Je souhaite résoudre les problèmes courants liés à Amazon SageMaker AI JumpStart.

Résolution

Vous ne pouvez pas afficher les modèles de fondation SageMaker

Si vous ne parvenez pas à afficher les modèles de fondation SageMaker AI sur la console SageMaker AI ou SageMaker AI Studio, l'une des erreurs suivantes peut s'afficher :

« There's been an error with your request. Please retry and contact support. » (Une erreur est survenue lors de votre requête. Veuillez réessayer et contacter le support.)

« Something went wrong: Please ensure that your account is authorized to read from Amazon S3 » (Un problème est survenu : assurez-vous que votre compte est autorisé à lire depuis Amazon S3)

Ces erreurs se produisent lorsque vous ne disposez pas de l'autorisation AWS Identity and Access Management (IAM) pour accéder aux politiques aws-marketplace ou des autorisations de lecture ou d'écriture pour Amazon Simple Storage Service (Amazon S3).

Pour accéder aux modèles de fondation SageMaker AI, utilisez la politique gérée AmazonSageMakerFullAccess. Si vous n'avez pas accès à cette politique, utilisez une stratégie de limitation qui inclut les autorisations requises pour le hub de modèle SageMaker AI Foundation.

Si vous avez reçu l'erreur sur la console SageMaker AI, ajoutez la politique suivante à votre rôle d'exécution IAM :

{
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEqualsIgnoreCase": {
                    "s3:ExistingObjectTag/SageMaker": "true"
                }
            }
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEquals": {
                    "s3:ExistingObjectTag/servicecatalog:provisioning": "true"
                }
            }
        }

Remarque : Remplacez example-bucket par votre compartiment Amazon S3.

Si vous avez reçu l'erreur concernant SageMaker AI Studio, ajoutez la politique suivante à votre rôle d'exécution de domaine :

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:InvokePlaygroundEndpoint",
                "aws-marketplace:Subscribe",
                "aws-marketplace:ViewSubscriptions"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
            ]
        }
    ]
}

Vous recevez l’erreur « HeadObject operation: Not Found » (Opération HeadObject : introuvable)

Lorsque vous définissez l'attribut model_version de bloc-notes SageMaker AI Studio sur * pour utiliser la dernière version du modèle, le message d'erreur suivant peut s'afficher :

« An error occurred (404) when calling the HeadObject operation: Not Found » (Une erreur s'est produite (404) lors de l'appel de l'opération HeadObject : introuvable)

Cette erreur se produit lorsque SageMaker met à jour tous les modèles pour utiliser des artefacts de modèle non compressés. Pour résoudre ce problème, définissez l'attribut model_version de votre bloc-notes sur une version de modèle exacte.

Le message d'erreur « Your invocation timed out » (Votre appel a expiré) s'affiche

Un délai d'appel se produit lorsque le traitement de l'appel prend plus d'un certain nombre de secondes. Par conséquent, vous recevez le message d’erreur suivant :

« Error: Your invocation timed out while waiting for a response from container primary. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again. » (Votre appel a expiré alors que vous attendiez une réponse du conteneur primaire. Examinez les métriques de latence pour chaque conteneur dans Amazon CloudWatch, remédiez au problème et réessayez.)

Pour résoudre ce problème, définissez le temps de traitement sur un seuil sûr.

Pour éviter un délai d'appel, appliquez les bonnes pratiques suivantes :

  • Pour maintenir le temps de traitement en dessous du seuil que vous avez spécifié, limitez le nombre de jetons générés.
  • Si nécessaire, divisez l'entrée en plusieurs appels. Combinez également les réponses pour fournir un contexte.
  • Utilisez une réponse en flux.
  • Si les requêtes parallèles ou les environnements à locataires multiples sont lents, augmentez votre seuil de sécurité sur le nombre maximal de jetons.

Il est également recommandé de désactiver les nouvelles tentatives automatiques du client boto3 qui provoquent la répétition du délai d'attente plusieurs fois :

import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))

Pour continuer à résoudre les problèmes, consultez les métriques Amazon CloudWatch pour les points de terminaison d'inférence Amazon Bedrock ou SageMaker AI.

Informations connexes

Activer Amazon SageMaker JumpStart pour des rôles d'exécution IAM personnalisés

Algorithmes intégrés avec table de modèles pré-entraînés sur le site Web de SageMaker

Présentation de JumpStart : du texte à l'image sur le site web de GitHub