我想在 Amazon Bedrock 中使用匯入的模型,但收到 ModelNotReadyException 錯誤。
Amazon Bedrock 使用內部移出政策來有效地管理資源。此政策會移除 Amazon Bedrock 在一定時間內 (通常為一小時) 未使用的模型。如果您嘗試使用尚未啟動的模型,則可能會收到 ModelNotReadyException 錯誤。
如果您嘗試在 Amazon Bedrock 中,使用政策為最佳化硬體使用率而移除的已匯入模型,則可能會收到如下的 ModelNotReadyException 錯誤訊息:
"errorMessage": "Model is not ready for inference.Wait and try your request again."
**注意:**匯入的模型沒有相當於佈建輸送量的功能。
最佳做法是排程任務,以維持模型的持續負載。此外,您還可以批次處理類似的請求,以最大限度地減少模型調用之間的閒置時間。
使用 Amazon Bedrock 主控台或 AWS API 確認您是否已匯入模型
使用 Amazon Bedrock 主控台
請完成下列步驟:
使用 AWS API
若要確認您是否已匯入模型,請呼叫 GetModelImportJob API。若要確認您是否已成功匯入並部署模型,請檢查輸出的狀態欄位是否為完成。
當您在移出後第一次調用模型時,會進行還原程序。還原時間取決於隨需機群的可用性和模型的大小。如果您的 InvokeModel 或 InvokeModelWithResponseStream API 請求在模型還原時傳回 ModelNotReadyException,則預設情況下,該請求將自動以指數退避進行重試。
若要設定最大重試次數,請參閱處理 ModelNotReadyException。
實作活動訊號策略,定期向模型傳送 ping 請求。ping 請求會告知 Amazon Bedrock 該模型仍在使用中。最佳做法是在關鍵作業之前執行預熱請求,以避免在 Amazon Bedrock 移出模型後出現冷啟動。
若要實作活動訊號策略,請完成以下步驟:
如果您仍然遇到問題,請在 AWS 管理主控台的 Support 中心建立支援票證。
計算執行自訂模型的成本