Salta al contenuto

Come posso monitorare e ottimizzare i costi in AWS Glue per Apache Spark?

4 minuti di lettura
0

Desidero monitorare il mio utilizzo di Spark in AWS Glue e ottimizzare i costi.

Risoluzione

Monitora l'utilizzo

Per ottenere un riepilogo dei costi legati all'utilizzo di Spark nei processi AWS Glue, utilizza AWS Cost Explorer.

Completa i seguenti passaggi:

  1. Apri la console Gestione costi e fatturazione AWS.
  2. Nel pannello di navigazione, scegli Cost Explorer.
  3. Nella dashboard Costo, visualizza i costi mensili di AWS Glue.

Visualizza l'utilizzo in base ai dettagli del processo

Per monitorare i dettagli del processo AWS Glue, come lo stato di esecuzione, la durata dell'esecuzione o l'utilizzo dell'unità di elaborazione dati (DPU), completa i seguenti passaggi:

  1. Apri la console AWS Glue.
  2. In Processi ETL, scegli Job run monitoring (Monitoraggio dell'esecuzione dei processi).

Visualizza i costi per tipo di processo

Per calcolare i costi per un tipo specifico di processo AWS Glue, completa i seguenti passaggi:

  1. Apri la console Gestione costi e fatturazione AWS.
  2. In Analisi dei costi e dell'utilizzo, scegli Cost Explorer.
  3. In Parametri report, nella sezione Filtri, per Servizio, scegli Glue.
  4. In Tipo di utilizzo, seleziona il filtro per il processo e includi la Regione AWS:
    Per un processo standard, utilizza il filtro ETL-DPU-Hour. Ad esempio, per la Regione Stati Uniti occidentali (Oregon), applica USW2-ETL-DPU-Hour.
    Per un processo flessibile, utilizza il filtro ETL-Flex-DPU-Hour. Ad esempio, applica USW2-ETL-Flex-DPU-Hour.
    Per una sessione interattiva, utilizza GlueInteractiveSession-DPU-Hour. Ad esempio, applica USW2-GlueInteractiveSession-DPU-Hour.

Calcola l'utilizzo e il costo di un processo specifico

Per calcolare il costo di un processo AWS Glue specifico, completa i seguenti passaggi:

  1. Apri la console AWS Glue.
  2. In Processi ETL, scegli Job run monitoring (Monitoraggio dell'esecuzione dei processi).
  3. Individua il valore Ore DPU utilizzate per il processo.
  4. Nella pagina Prezzi di AWS Glue, nella scheda Processi ETL e sessioni interattive, seleziona la tua Regione.
  5. Annota il costo di ogni ORA DPU per il tipo di processo specifico.
  6. Per calcolare il costo, moltiplica il numero di ore DPU per il costo di ogni ORA DPU.

Per ottenere le metriche dei processi AWS Glue per l'utilizzo della memoria o della CPU o per il traffico di dati, configura un allarme CloudWatch.

Per ricevere notifiche sul processo AWS Glue, consulta Come posso ricevere avvisi Amazon SNS quando il mio processo AWS Glue cambia stato?

Ottimizza il costo

Per ottimizzare i costi di utilizzo di Spark nei processi AWS Glue, intraprendi le seguenti azioni:

Informazioni correlate

Monitor and optimize cost on AWS Glue for Apache Spark (Monitoraggio e ottimizzazione dei costi in AWS Glue per Apache Spark)

AWS UFFICIALEAggiornata un anno fa