Quero monitorar meu uso do Spark com o AWS Glue e otimizar os custos.
Resolução
Monitorar o uso
Para obter um resumo do custo de uso do Spark em seus trabalhos do AWS Glue, use o Explorador de Custos da AWS.
Conclua as etapas a seguir:
- Abra o console do Gerenciamento de Faturamento e Custos da AWS.
- No painel de navegação, escolha Explorador de Custos.
- No painel de Custos, veja os custos mensais do AWS Glue.
Exibir detalhes de uso por trabalho
Para monitorar os detalhes do trabalho do AWS Glue, como status de execução, duração da execução ou uso da unidade de processamento de dados (DPU), conclua as etapas a seguir:
- Abra o console do AWS Glue.
- Em Trabalhos de ETL, escolha Monitoramento da execução de trabalhos.
Exibir custo por tipo de trabalho
Para obter os custos de um tipo específico de trabalho do AWS Glue, conclua as etapas a seguir:
- Abra o console do Gerenciamento de Faturamento e Custos da AWS.
- Em Análise de custo e uso, escolha Explorador de custos.
- Em Parâmetros do relatório, na seção Filtros, em Serviço, escolha Glue.
- Em Tipo de uso, selecione o filtro do seu trabalho e inclua sua região da AWS:
Em um trabalho padrão, use o filtro ETL-DPU-Hour. Por exemplo, para a região Oeste dos EUA (Oregon), aplique USW2-ETL-DPU-Hour.
Em um trabalho flexível, use o filtro ETL-Flex-DPU-Hour. Por exemplo, aplique USW2-ETL-Flex-DPU-Hour.
Em uma sessão interativa, use o GlueInteractiveSession-DPU-Hour. Por exemplo, aplique USW2-GlueInteractiveSession-DPU-Hour.
Obter o uso e o custo de um trabalho específico
Para obter o custo de um trabalho específico do AWS Glue, conclua as etapas a seguir:
- Abra o console do AWS Glue.
- Em Trabalhos de ETL, escolha Monitoramento da execução de trabalhos.
- Encontre as horas de DPU que você usou no trabalho.
- Na página de Preços do AWS Glue, na guia Trabalhos de ETL e sessões interativas, selecione sua região.
- Anote o custo de cada DPU-HOUR para seu tipo de trabalho.
- Para calcular o custo, multiplique suas horas de DPU pelo custo de cada DPU-HOUR.
Para obter métricas de trabalho do AWS Glue em relação a uso de memória, CPU ou tráfego de dados, configure um alarme do CloudWatch.
Para receber notificações sobre seu trabalho no AWS Glue, consulte Como faço para receber notificações do Amazon SNS quando meu trabalho no AWS Glue muda de estado?
Otimizar custos
Para otimizar os custos de uso do Spark em trabalhos do AWS Glue, execute as seguintes ações:
Informações relacionadas
Monitorar e otimizar os custos no AWS Glue para Apache Spark