1 Answer
- Newest
- Most votes
- Most comments
0
【以下的回答经过翻译处理】 一个目标跟踪扩展策略将创建2个CloudWatch警报(一个用于高使用率,一个用于低使用率),您可以在CloudWatch警报控制台中查看。高使用率策略需要具有连续3个60秒突破数据点来触发扩展;低警报需要连续15个60秒违规数据点才能缩小规模。
相反,您可能希望使用阶梯缩放策略,可以在其中创建和控制警报以及策略设置。 https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-step-scaling-policies.html
谢谢,一旦我了解到该策略是由CloudWatch警报管理的,我就可以观察到我的策略在工作——特别是,我将指标更改为HasBacklogWithoutCapacity,目标更改为0.5,我使用了Maximum而不是average,它的行为符合我的要求。我确实注意到,从我向队列提交推理作业到度量从0增加到1(大约2-3分钟),然后等待3个连续值之间也有一些延迟,因此总的来说,触发开始添加容量大约需要5分钟,而不是3分钟。我会尝试逐步扩展来减少这种情况,但至少我现在有了一个可以与批量推理进行比较的概念验证。
Relevant content
- asked a year ago
- asked a year ago
- Accepted Answerasked 10 months ago
- AWS OFFICIALUpdated a year ago
- AWS OFFICIALUpdated 2 years ago
- AWS OFFICIALUpdated 2 years ago
- AWS OFFICIALUpdated 2 years ago