跳至內容

如何解決在 Amazon Bedrock 上微調模型時發生的錯誤?

2 分的閱讀內容
0

我想要對在 Amazon Bedrock 上微調模型時收到的錯誤進行疑難排解。

解決方法

**注意:**如果您在執行 AWS Command Line Interface (AWS CLI) 命令時收到錯誤訊息,請參閱對 AWS CLI 錯誤進行疑難排解。此外,請確定您使用的是最新的 AWS CLI 版本

存取與可用性問題

先決條件: 請求存取基礎模型

Amazon Bedrock 支援在某些 AWS 區域及基礎模型進行微調。請確保您使用支援微調功能的 AWS 區域來執行模型。 如果您的區域不支援您的模型,Amazon Bedrock 模型選擇器將會持續載入。如果您無法建立微調作業,那麼您可能會收到以下錯誤訊息:

「Unable to Create a fine-tuning job ("The provided model identifier is invalid" error)」

若要解決存取錯誤,請確認模型及微調功能在您偏好的 AWS 區域受支援

如果您看到空白畫面或無法選取模型,表示該模型在該區域不可用,或您的 AWS 帳戶無權存取該模型。若要解決此問題,請在不同的網路與瀏覽器中選取模型。選取模型時,請擷取 HAR 檔案。接著,確認您的 VPN、防火牆或虛擬桌面基礎結構 (VDI) 沒有受到限制。如果仍無法存取 Amazon Bedrock 主控台,請聯絡您的網路管理員。

IAM 權限問題

若要存取 Amazon Simple Storage Service (Amazon S3) 儲存貯體以自訂模型,您必須將正確權限附加至 AWS Identity and Access Management (IAM) 角色。如果您未正確設定 IAM 角色的權限,將收到以下錯誤訊息:

「Encountered an unexpected error when processing the request, please try again","AccessDenied".」

若要解決此錯誤,請授予 Amazon Bedrock IAM 權限以進行模型自訂。

跨區域存取錯誤

微調作業只能存取與作業執行區域相同的 Amazon S3 資料。如果您嘗試存取儲存在與微調作業不同區域的 S3 儲存貯體中的訓練資料,那麼您將收到以下錯誤訊息:

「Could not validate GetObject permissions to access S3 bucket」

若要解決此錯誤,請確認您的 S3 儲存貯體與 Amazon Bedrock 微調作業位於相同區域。接著,將訓練資料移至與 Amazon Bedrock 相同區域的 S3 儲存貯體

資料格式與驗證錯誤

您的資料集必須符合訓練與驗證模型需求。如果您提交的訓練資料集 JSON 結構或格式不正確,那麼您可能會收到以下其中一個錯誤:

「The provided S3 URI is invalid」、「;validation error detected: Value 's3://..' failed to satisfy constraint:" Member must satisfy regular expression pattern..」

「Invalid training input data configuration.Check the input data S3 Uris(Uri should be a file, not a directory) and retry request」

若要解決此問題,請確保使用檔案統一資源識別碼 (URI),並確認未使用目錄 URI。

**網址範例:**s3://bucket-name/datasets/train/train.jsonl

**目錄網址範例:**s3://bucket-name/datasets/train/

接著,確認路徑指向正確的檔案位置。如果路徑未指向正確的檔案位置,請確認 S3 儲存貯體中的完整路徑結構。 更新您的檔案 URI,使其符合儲存訓練資料的精確位置與檔案名稱。

資料集結構驗證

不同的文字模型有不同的資料需求與預期 JSON 結構描述。如果您提交的訓練資料集 JSON 結構或格式不正確,那麼您可能會收到以下錯誤:

「JSON structure is not supported: JSON schema error: JSON does not match JSON schema at line.」

若要解決此錯誤,請為文字對文字模型微調準備資料

影像微調問題

Amazon Bedrock 必須能存取指定尺寸的影像檔案。如果您上傳的影像不符合所微調模型的尺寸要求,那麼您可能會收到以下錯誤:

「Image Dimensions are Invalid.Check that the images conform to accepted dimensions.」

檢查影像尺寸是否符合特定模型的要求。接著,驗證您為特定模型準備的影像資料集

**注意:**某些模型只支援文字微調,並不支援影像微調。

驗證錯誤

您的檔案必須與模型相容。如果您提交的訓練資料不符合模型格式要求或包含結構問題,那麼您可能會收到以下錯誤:

「Validation error: failed during preprocessing」

若要解決此錯誤,請確認您的資料格式

  • 確保 JSONL 檔案每行有一個有效 JSON 物件。
  • 檢查每個範例是否包含必要欄位。
  • 確認範例未超過模型的最大權杖配額。
  • 確認檔案使用 UTF-8 編碼,且無特殊字元問題。

監控作業狀態

您可以使用 Amazon Bedrock 主控台或 AWS CLI 監控作業狀態。Amazon Bedrock 不提供即時進度監控。

若要使用主控台,請參閱監控您的模型自訂作業

若要使用 AWS CLI,請執行以下 get-model-customization-job 命令:

aws bedrock get-model-customization-job -job-identifier "jobARN"

**注意:**將 jobARN 替換為您的作業 Amazon Resource Name (ARN)。

接著,您可以估算完成每個作業所需的時間,以作為與模型實際完成時間的基準。估算時,請考量以下因素:

  • 微調持續時間取決於資料大小、epoch 數量及批次大小。
  • 早期錯誤通常會在最初幾分鐘內出現。
  • 對於較大資料集,微調可能需要數小時完成。
  • 訓練時間通常持續 3-4 小時,最多可達 24 小時,視組態與流量而定。

如果作業失敗,請參閱模型自訂問題疑難排解

如果作業已處於訓練狀態超過 24 小時,請聯絡 AWS Support。

經微調的模型推論

對於自訂經微調的模型,您必須購買佈建輸送量,以便為非 Amazon Nova 模型建立單獨的佈建模型 ARN,並用於取代原始模型 ARN。

如果您嘗試在 API 呼叫中直接使用原始模型 ARN,可能會收到以下錯誤:

「An error occurred (ValidationException) when calling the xxxx operation: 1 validation error detected: Value 'arn:aws:bedrock:xxxxx' at 'modelId' failed to satisfy constraint: Member must satisfy regular expression pattern: ...」

若要解決此錯誤,請完成以下步驟:

  1. 為經微調的模型建立佈建輸送量
  2. 記下回應中的佈建模型 ARN。
  3. 當您透過 API 呼叫經微調的模型時,請使用自訂模型專屬的以下模型 ARN 格式:
    arn:aws:bedrock:[region]:[account]:provisioned-model/[name]
    **注意:**將 region 替換為您的區域,將 account 替換為您的帳戶資訊,並將 name 替換為您的模型名稱。
  4. 在使用 GetProvisionedModelThroughput API 呼叫之前,請確認佈建模型處於 InService 狀態。

相關資訊

為自訂模型設定推論

自訂您的模型以提升其在您使用案例中的效能

AWS 官方已更新 3 個月前