1개 답변
- 최신
- 최다 투표
- 가장 많은 댓글
0
【以下的回答经过翻译处理】 当端点大小缩到0时,您不需要支付任何计算成本的费用。但我认为您可以设计得更好。在SageMaker端点中,还有一些其他选项可供您使用(假设您正在使用实时端点):1. 尝试使用SageMaker无服务器推理。它具有完全的无服务器性质,因此只有在端点提供推理时才需支付费用。我认为这更适合您的要求。2. 您也可以考虑使用Lambda,这将减少您的托管成本。但是,您需要更多地设置推理堆栈。3. 还有SageMaker异步推理选项,但它主要适用于需要更长时间处理每个请求的推理。之所以提到它,是因为它也支持在没有流量时缩放到0。
관련 콘텐츠
- AWS 공식업데이트됨 일 년 전
- AWS 공식업데이트됨 2년 전