1回答
- 新しい順
- 投票が多い順
- コメントが多い順
0
【以下的回答经过翻译处理】 当端点大小缩到0时,您不需要支付任何计算成本的费用。但我认为您可以设计得更好。在SageMaker端点中,还有一些其他选项可供您使用(假设您正在使用实时端点):1. 尝试使用SageMaker无服务器推理。它具有完全的无服务器性质,因此只有在端点提供推理时才需支付费用。我认为这更适合您的要求。2. 您也可以考虑使用Lambda,这将减少您的托管成本。但是,您需要更多地设置推理堆栈。3. 还有SageMaker异步推理选项,但它主要适用于需要更长时间处理每个请求的推理。之所以提到它,是因为它也支持在没有流量时缩放到0。
関連するコンテンツ
- AWS公式更新しました 1年前
- AWS公式更新しました 2年前
- AWS公式更新しました 1年前