Amazon EMR에서 실패하거나 중단된 Spark SQL 쿼리 문제를 해결하려면 어떻게 해야 하나요?

3분 분량
0

Amazon EMR에서 Spark SQL 쿼리와 관련된 문제를 해결하기 위해 정보를 수집하려고 합니다.

해결 방법

Spark SQL 완료 쿼리는 EMR 클러스터의 Spark History Server의 애플리케이션 사용자 인터페이스 탭에 있습니다. 자세한 내용은 영구 애플리케이션 사용자 인터페이스 보기를 참고하세요.

완료된 Spark SQL 쿼리에 액세스하려면 다음을 수행하세요.

  1. Spark History Server에서 SQL/DataFrame을 선택해 완료된 Spark SQL 쿼리를 확인합니다.
  2. 쿼리의 Spark SQL 작업 애플리케이션 ID를 선택해 작업 탭에서 완료된 작업 ID 정보를 엽니다. SQL 쿼리에는 작업 ID가 두 개 이상 있을 수 있다는 점에 유의하세요.

작업 탭에서는 다음 정보를 확인할 수 있습니다.

  • 작업 탭에서 작업 상태, 작업 기간 및 관련 SQL 쿼리를 볼 수 있습니다.
  • 작업 탭에서 애플리케이션 ID의 타임라인을 검토할 수 있습니다. 타임라인에는 Spark 실행기가 추가 및 제거한 작업이 시간순으로 표시됩니다.
  • 아래로 내려 DAG(방향성 비순환 그래프)를 확인합니다. DAG는 Spark SQL 쿼리를 시각화한 것입니다. RDD 종속성 체인도 확인할 수 있습니다.
  • 더 아래로 내리면 Spark SQL 작업의 완료 단계를 볼 수 있습니다.
  • 단계 ID 설명을 선택하면 모든 작업의 쿼리 총시간, 지역 수준 요약 및 관련 작업 ID를 확인할 수 있습니다. 단계 보기에서는 각 단계에 해당하는 RDD의 모든 세부 정보를 볼 수 있습니다. 또한 이 보기에서는 상위 레벨 Spark SQL 작업과 관련된 하위 레벨 RDD 운영 정보도 볼 수 있습니다.
  • 실행기별 집계 지표를 확장해 실행기 로그를 확인합니다. 실행기 로그에는 Spark SQL 작업과 관련된 추가 세부 정보가 표시됩니다.

다음은 예제 로그입니다.

23/01/17 18:10:17 INFO Executor: Finished task 0.0 in stage 16.0 (TID 16). 1882 bytes result sent to driver
23/01/17 18:10:17 INFO YarnCoarseGrainedExecutorBackend: Got assigned task 17
23/01/17 18:10:17 INFO Executor: Running task 0.0 in stage 17.0 (TID 17)
23/01/17 18:10:17 INFO TorrentBroadcast: Started reading broadcast variable 17 with 1 pieces (estimated total size 4.0 MiB)
23/01/17 18:10:17 INFO MemoryStore: Block broadcast_17_piece0 stored as bytes in memory (estimated size 7.2 KiB, free 4.8 GiB)
23/01/17 18:10:17 INFO TorrentBroadcast: Reading broadcast variable 17 took 8 ms
23/01/17 18:10:17 INFO MemoryStore: Block broadcast_17 stored as values in memory (estimated size 13.8 KiB, free 4.8 GiB)
23/01/17 18:10:17 INFO PythonRunner: Times: total = 52, boot = -31, init = 83, finish = 0
23/01/17 18:10:17 INFO Executor: Finished task 0.0 in stage 17.0 (TID 17). 1883 bytes result sent to driver
23/01/17 18:11:20 ERROR CoarseGrainedExecutorBackend: RECEIVED SIGNAL TERM
23/01/17 18:11:20 INFO MemoryStore: MemoryStore cleared
23/01/17 18:11:20 INFO BlockManager: BlockManager stopped
23/01/17 18:11:20 INFO ShutdownHookManager: Shutdown hook called

자세한 내용은 Apache Spark 설명서에서 웹 UI 섹션에 있는 작업 탭을 참고하세요.

관련 정보

로그 파일 검사

AWS 공식
AWS 공식업데이트됨 2년 전