1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 你好,
请参考我的回答。
问题:是否可以在使用持续的终端节点时使用Sagemaker批处理?
答:目前SageMaker没有这个选项。
问题:另一种选择是使用客户端批处理(使用上述代码)-但如果我创建多个实例,我能确定每个批次返回的顺序和我的请求顺序一致吗?在上面的示例中,我需要压缩输入和输出。
答:当您将每个批发送到终端节点时,请求是同步的,您的应用程序将立即等待获取响应。响应将按您发送的顺序返回。因此,维护顺序是如何管理您的请求的问题。无论您在终端节点中使用多少个实例。
问题:是否有更好的方法来处理这个工作负载-我感觉这个方法可能介于API和Batch模式之间?
答:这里有两个主要问题:
- 成本
- 时间
根据您的业务需求和上述两个因素之间的重要性,或者您是否需要在两者之间找到平衡,SageMaker具有下列推理选项可能对您的情况有用:
- 实时推理:在此处,您为终端节点预留资源,并保持运行状态,因此当您需要进行预测时,您可以立即使用它而无需等待。成本基于终端节点处于"InService"状态的时间以及实例的数量和类型(请参见定价页面)。
- 批量推理:在这里,您发送了大量的记录,您想要获得预测结果。首先需要预配置资源,这可能需要几分钟时间,然后才会进行实际的预测。费用将根据预测所需的时间进行计算。
从理论上讲,在选项1和选项2中,预测所需的时间应该非常接近。然而,在方案1中,您预先配置了终端节点,因此在调用时会感觉更快,因为您的实例已经提前准备好了。但这也伴随着额外的费用。
如果这个选项适合您,您可以在开始预测之前预先配置终端节点,并在预测结束后将其删除。这样您就可以兼顾两种方式的优势。
然而,目前并没有资源是持久性的选项,您可以随时开始预测。这是因为涉及到费用和运营考虑的问题。
相关内容
- AWS 官方已更新 2 年前
- AWS 官方已更新 1 年前
- AWS 官方已更新 2 个月前
- AWS 官方已更新 3 个月前