La metrica di utilizzo della CPU o della GPU di Amazon CloudWatch per il mio endpoint Amazon SageMaker è superiore al 100%.
Risoluzione
La metriche CPUUtilization e GPUUtilization di CloudWatch mostrano la percentuale di unità CPU o GPU utilizzate dai container. Il valore viene moltiplicato per il numero di CPU o GPU, motivo per cui il valore può essere superiore al 100%.
Ecco alcuni esempi:
- Per un'istanza non GPU come ml.m4.xlarge, la metrica CPUUtilization può variare dallo 0 al 400% poiché l'istanza dispone di quattro vCPU.
- Per un'istanza GPU come ml.p3.8xlarge, la metrica CPUUtilization può variare dallo 0 al 3200%. La metrica GPUUtilization può variare dallo 0 al 400%. Questo perché l'istanza dispone di 32 vCPU e 4 GPU.
- Per più istanze, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della CPU o della GPU in tutte le istanze. Ad esempio, se hai cinque istanze ml.m4.xlarge, la metrica CPUUtilization può variare dallo 0 al 400% perché ogni istanza ha quattro vCPU.
Per ulteriori informazioni sulle metriche CPUUtilization e GPUUtilization , consulta la pagina Monitor Amazon SageMaker with Amazon CloudWatch. Per visualizzare un elenco che indica quante vCPU o GPU ci sono in ogni tipo di istanza, consulta la pagina Prezzi di Amazon SageMaker.