EMR 클러스터 크기를 조정하는 동안 Amazon EMR 스팟 인스턴스가 프로비저닝되지 않습니다.
해결 방법
Amazon Elastic Compute Cloud(Amazon EC2)는 다음과 같은 이유로 언제든지 스팟 인스턴스를 중단할 수 있습니다.
- 스팟 용량이 부족합니다.
- 요청 제약을 충족할 수 없습니다.
- 스팟 가격이 지정된 최고 가격보다 높습니다.
- 스팟 계정 할당량이 소진되었습니다. 이 경우 증가를 요청할 수 있습니다.
자세한 내용은 Amazon EC2가 스팟 인스턴스를 중단한 이유는 무엇인가요?를 참조하세요.
**참고:**상태 비저장, 내결함성 및 중단을 견딜 수 있을 만큼 유연한 워크로드에는 스팟 인스턴스를 사용하는 것이 가장 좋습니다.
또한 부트스트랩 스크립트가 수정되었거나 오류가 있기 때문에 스팟 인스턴스 및 온디맨드 인스턴스의 크기가 조정되지 않을 수 있습니다.
/emr/instance-controller/log/bootstrap-actions 또는 s3://cluster_id/node-failed/bootstrap-actions/stderr.gz에서 부트스트랩 스크립트에 대한 로그를 확인하세요. 로그에는 STARTUP_SCRIPT_FAILED_RET_CODE 오류가 표시됩니다.
예를 들어 다음 부트스트랩 작업 로그는 부트스트랩 작업 1(emr\ _bootstrap\ _actions.sh)이 실패했음을 보여줍니다.
Another app is currently holding the yum lock; waiting for it to exit...
The other application is: yum
Memory : 125 M RSS (444 MB VSZ)
Started: Tue Jul 19 05:36:36 2022 - 00:03 ago
State : Running, pid: 7914
Error: Package: falcon-sensor-4.18.0-6403.amzn2.x86_64 (/falcon-sensor-4.18.0-6403.amzn2.x86_64)
Requires: systemd
위 오류가 표시되면 다음과 같은 동작이 발생합니다.
- 새 교체 노드가 모두 종료됩니다.
- 노드가 새 대체 인스턴스 프로비저닝을 중단합니다.
- 코어 노드 인스턴스 그룹은 다음 예와 같이 중지 모드로 전환됩니다.
"state": "ARRESTED",
"message": "Instance group ig-2JN5xxxxxxxx in Amazon EMR cluster j-37H4xxxxxxx (emr-xxxxx-spark-cluster) was arrested at for the following reason: Error provisioning instances."
=====
관련 정보
스팟 인스턴스 중단
스팟 요청 상태
스팟 인스턴스 모범 사례
최고 가격이 스팟 가격보다 높은데도 스팟 인스턴스가 종료되는 이유는 무엇인가요?