跳至內容

如何對 SageMaker AI JumpStart 的常見問題進行疑難排解?

2 分的閱讀內容
0

我想對 Amazon SageMaker AI JumpStart 的常見問題進行疑難排解。

解決方法

您無法查看 SageMaker 基礎模型

如果您無法在 SageMaker AI 主控台或 SageMaker AI Studio 上查看 SageMaker AI 基礎模型,那麼您可能會收到以下錯誤之一:

「您的請求出現錯誤。請重試並聯絡支援人員。」

「發生問題: 請確認您的帳戶有權從 Amazon S3 讀取」

當您沒有 AWS Identity and Access Management (IAM) 權限來存取 aws-marketplace 原則,或沒有 Amazon Simple Storage Service (Amazon S3) 的讀取和寫入權限時,就會發生這些錯誤。

若要存取 SageMaker AI 基礎模型,請使用 AmazonSageMakerFullAccess 受管政策。如果您無法存取此政策,請使用包含 SageMaker AI 基礎模型中心所需權限的縮小範圍政策。

如果您在 SageMaker AI 主控台上收到錯誤,請將以下政策新增至您的 IAM 執行時期角色:

{
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEqualsIgnoreCase": {
                    "s3:ExistingObjectTag/SageMaker": "true"
                }
            }
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::example-bucket/*",
            "Condition": {
                "StringEquals": {
                    "s3:ExistingObjectTag/servicecatalog:provisioning": "true"
                }
            }
        }

注意:example-bucket 替換為您的 Amazon S3 儲存貯體。

如果您收到 SageMaker AI Studio 的錯誤,請將以下政策新增至您的網域執行時期角色:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:InvokePlaygroundEndpoint",
                "aws-marketplace:Subscribe",
                "aws-marketplace:ViewSubscriptions"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:SageMakerFoundationHubAppConfigLambdaFunction"
            ]
        }
    ]
}

您收到「HeadObject 作業: 找不到」錯誤

當您將 SageMaker AI Studio 筆記本的 model_version 屬性設為 * 以使用模型的最新版本時,您可能會收到以下錯誤訊息:

「呼叫 HeadObject 作業時發生錯誤 (404): 找不到」

當 SageMaker 更新所有模型以使用未壓縮的模型成品時,就會發生此錯誤。若要解決此問題,請將筆記本的 model_version 屬性設定為精確的模型版本。

您收到「您的呼叫逾時」錯誤

當調用處理所花費的時間超過指定的秒數時,就會發生調用逾時。因此,您會收到下列錯誤訊息︰

「錯誤: 等待容器主要回應時,您的調用逾時。查看 Amazon CloudWatch 中每個容器的延遲指標,解決問題,然後再試一次。」

若要解決此問題,請將處理時間設定為安全閾值。

為了避免調用逾時,請使用以下最佳做法:

  • 為了將處理時間保持在指定的閾值以下,請限制產生的權杖數量。
  • 如果需要,將輸入分成多個調用。此外,結合回應來提供背景資訊。
  • 使用串流回應。
  • 如果並行請求或多租用戶環境緩慢,則增加最大權杖的安全閾值。

此外,最佳做法是關閉導致逾時重複多次的 boto3 用戶端的自動重試:

import botocore; config=botocore.config.Config(retries=dict(max_attempts=0))

若要繼續進行疑難排解,請檢查 Amazon Bedrock 或 SageMaker AI 推論端點的 Amazon CloudWatch 指標。

相關資訊

為自訂 IAM 執行角色啟用 Amazon SageMaker JumpStart

SageMaker 網站上帶有預先訓練模型資料表的內建演算法

GitHub 網站上的 JumpStart 簡介 - 文字轉影像

AWS 官方已更新 10 個月前