跳至内容

如何对 SageMaker AI JumpStart 的常见问题进行故障排除?

2 分钟阅读
0

我想对 Amazon SageMaker AI JumpStart 的常见问题进行故障排除。

解决方法

无法查看 SageMaker 基础模型

如果您无法在 SageMaker AI 控制台或 SageMaker AI Studio 上查看 SageMaker AI 基础模型,您可能会收到以下错误之一:

“您的请求出错。请重试并联系支持人员。”

“发生了错误: 请确保您的账户已获授权,可以从 Amazon S3 进行读取”

当您没有访问 aws-marketplace 策略的 AWS Identity and Access Management (IAM) 权限,或没有 Amazon Simple Storage Service (Amazon S3) 的读取或写入权限时,将会出现这些错误。

要访问 SageMaker AI 基础模型,请使用 AmazonSageMakerFullAccess 托管式策略。如果您无权访问此策略,请使用包含访问 SageMaker AI 基础模型中心所需权限的范围缩小策略。

如果您在 SageMaker AI 控制台上收到错误,请将以下策略添加到您的 IAM 运行时角色中:

{
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEqualsIgnoreCase": {
                    "s3:ExistingObjectTag/SageMaker": "true"
                }
            }
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEquals": {
                    "s3:ExistingObjectTag/servicecatalog:provisioning": "true"
                }
            }
        }

**注意:**请将 example-bucket 替换为您的 Amazon S3 存储桶。

如果您收到有关 SageMaker AI Studio 的错误,请将以下策略添加到您的域运行时角色中:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:InvokePlaygroundEndpoint",
                "aws-marketplace:Subscribe",
                "aws-marketplace:ViewSubscriptions"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
            ]
        }
    ]
}

您收到“HeadObject operation: Not Found(HeadObject 操作:未找到)错误

当您将 SageMaker AI Studio 笔记本的 model_version 属性设置为 * 以使用模型的最新版本时,您可能会收到以下错误消息:

“调用 HeadObject 操作时出现错误 (404): 未找到”

当 SageMaker 更新所有模型以使用未压缩的模型构件时,将会出现此错误。要解决此问题,请将笔记本的 model_version 属性设置为确切的模型版本。

您收到“Your invocation timed out”(您的调用超时)错误

当调用的处理时间超过指定的秒数时,将会出现调用超时。因此,您将收到以下错误消息:

“错误: 在等待主容器响应时,您的调用超时。请查看 Amazon CloudWatch 中每个容器的延迟指标,解决问题,然后重试。”

要解决此问题,请将处理时间设置为安全阈值。

为避免调用超时,请使用以下最佳实践:

  • 要将处理时间保持在指定的阈值以下,请限制生成的令牌数量。
  • 如果需要,请将输入拆分为多个调用。此外,请合并响应以提供上下文。
  • 使用流式响应。
  • 如果并行请求或多租户环境运行缓慢,请提高最大令牌数的安全阈值。

此外,最佳做法是关闭 boto3 客户端的自动重试,这会导致超时重复多次:

import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))

要继续进行故障排除,请检查 Amazon Bedrock 或 SageMaker AI 推理端点的 Amazon CloudWatch 指标。

相关信息

Enable Amazon SageMaker JumpStart for custom IAM execution roles

SageMaker 网站上的 Built-in algorithms with pre-trained model table

GitHub 网站上的 Introduction to JumpStart - text to image