Quiero supervisar mi uso de Spark con AWS Glue y optimizar los costes.
Resolución
Supervisión del uso
Para obtener un resumen del coste del uso de Spark en tus trabajos de AWS Glue, utiliza el Explorador de costes de AWS.
Sigue estos pasos:
- Abre la consola de Administración de facturación y costes de AWS.
- En el panel de navegación, selecciona Explorador de costes.
- En el panel Costes, consulta los costes mensuales de AWS Glue.
Visualización de los detalles de uso por trabajo
Para supervisar los detalles del trabajo de AWS Glue, como el estado de ejecución, la duración de la ejecución o el uso de la unidad de procesamiento de datos (DPU), sigue estos pasos:
- Abre la consola de AWS Glue.
- En Trabajos de ETL, elige Supervisión de la ejecución del trabajo.
Visualización del coste por tipo de trabajo
Para obtener los costes de un tipo específico de trabajo de AWS Glue, sigue estos pasos:
- Abre la consola de Administración de facturación y costes de AWS.
- En Análisis de coste y uso, elige Explorador de costes.
- En Parámetros del informe, en la sección Filtros, en Servicio, elige Glue.
- En Tipo de uso, selecciona el filtro para tu trabajo e incluye tu región de AWS:
Para un trabajo estándar, utiliza el filtro ETL-DPU-Hour. Por ejemplo, para la región Oeste de EE. UU. (Oregón), aplica USW2-ETL-DPU-Hour.
Para un trabajo flexible, utiliza el filtro ETL-Flex-DPU-Hour. Por ejemplo, aplica USW2-ETL-Flex-DPU-Hour.
Para una sesión interactiva, utiliza GlueInteractiveSession-DPU-Hour. Por ejemplo, aplica USW2-GlueInteractiveSession-DPU-Hour.
Obtención del uso y el coste de un trabajo específico
Para obtener el coste de un trabajo específico de AWS Glue, sigue estos pasos:
- Abre la consola de AWS Glue.
- En Trabajos de ETL, elige Supervisión de la ejecución del trabajo.
- Encuentra las horas de DPU que has utilizado para el trabajo.
- En la página Precios de AWS Glue, en la pestaña Trabajos de ETL y sesiones interactivas, selecciona tu región.
- Anota el coste de cada DPU-HOUR para tu tipo de trabajo.
- Para calcular el coste, multiplica tus horas de DPU por el coste de cada DPU-HOUR.
Para obtener las métricas de trabajo de AWS Glue sobre el uso de la memoria o la CPU o el tráfico de datos, configura una alarma de CloudWatch.
Para recibir notificaciones sobre su trabajo de AWS Glue, consulta ¿Cómo puedo recibir las notificaciones de Amazon SNS cuando mi trabajo de AWS Glue cambia de estado?
Optimización de costes
Para optimizar los costes del uso de Spark en los trabajos de AWS Glue, toma las siguientes medidas:
Información relacionada
Supervisión y optimización de los costes en AWS Glue para Apache Spark