Amazon OpenSearch Service 클러스터의 노드 중 하나가 다운되었습니다. 또는 OpenSearch Service 노드가 계속 충돌합니다.
해결 방법
Java 가상 머신(JVM) 압력이 높거나 CPU 사용량이 많으면 노드에 과부하가 걸리므로 클러스터 노드가 실패할 수 있습니다. 하드웨어 장애로 인해 상태 확인에 실패한 경우에도 클러스터 노드 오류가 발생합니다.
실패한 노드 확인
다음 단계를 완료하십시오.
- OpenSearch Service 콘솔을 엽니다.
- 탐색 창의 관리형 클러스터에서 도메인을 선택합니다.
- OpenSearch Service 도메인을 선택합니다.
- 클러스터 상태 탭을 선택한 다음, 노드를 선택합니다. 노드 수가 클러스터에 구성한 수보다 적으면 노드가 다운된 것입니다.
참고: 클러스터 구성을 변경하거나 서비스를 정기적으로 유지 관리하는 동안 노드 지표가 정확하지 않을 수 있습니다. 이는 예상된 동작입니다.
과부하된 노드 식별 및 문제 해결
CPU 및 JVM 압력이 높으면 트래픽이 많기 때문에 클러스터에서 노드가 삭제될 수 있습니다. 노드가 부하를 관리할 수 없는 경우 응답하지 않고 충돌이 발생할 수 있습니다.
이 문제를 해결하려면 노드를 재부팅하십시오. 노드 재부팅 요구 사항을 준수해야 합니다.
그래도 문제가 발생하면 OpenSearch Service 클러스터의 CPU 사용률과 JVM 메모리 압력을 확인하고 줄이십시오.
하드웨어 장애 문제 식별 및 문제 해결
하드웨어 장애는 클러스터 노드의 가용성에 영향을 미칠 수 있습니다. OpenSearch Service는 각 노드에서 주기적인 상태 확인을 수행합니다. 노드가 상태 확인에 실패하면 OpenSearch Service에서 해당 노드가 클러스터에 다시 조인하거나 자동으로 새 정상 노드로 교체할 수 있습니다.
복제를 사용하여 데이터 손실 위험 줄이기
다음 명령을 실행하여 OpenSearch Service에서 충돌이 발생한 노드를 대체하는 경우에 인덱스 복제본을 백업으로 사용할 수 있도록 활성화합니다.
curl -XPUT 'domain-endpoint/indexname/_settings' -H 'Content-Type: application/json' -d'{ "index" : { "number_of_replicas" : 0 }}
참고: domain-endpoint를 도메인 엔드포인트로 바꾸고 indexname을 인덱스 이름으로 바꾸십시오.
복제본 샤드는 데이터 중복성을 제공하고 기본 샤드를 사용할 수 없게 되더라도 클러스터가 요청을 계속 처리할 수 있도록 합니다. 인덱스마다 하나 이상의 복제본을 구성하는 것이 가장 좋습니다. 복제본 샤드가 없는 다중 노드 클러스터는 데이터 손실 위험이 있습니다. 자세한 내용은 Amazon OpenSearch Service 도메인 크기 조정을 참조하십시오.
각 클러스터에서 데이터 노드를 두 개 이상 사용하는 것이 가장 좋습니다. 기본 샤드와 복제본 샤드를 동일한 노드에 할당할 수 없기 때문에 단일 노드 클러스터에는 복제본 샤드를 사용할 수 없습니다. 노드가 충돌하면 데이터 손실이 발생합니다. 이는 클러스터에 대해 세분화된 액세스 제어를 활성화한 경우에도 발생합니다. 단일 노드 클러스터가 충돌하는 경우 인덱스 스냅샷을 사용하여 손실된 데이터를 복원하십시오.
중요: 최신 스냅샷에서 캡처한 데이터만 복구할 수 있습니다.
다중 AZ 도메인 구성
다중 AZ 도메인을 구성할 때 OpenSearch Service는 여러 가용 영역에서 데이터 노드를 시작합니다. OpenSearch Service는 기본 샤드와 해당 복제본 샤드를 여러 가용 영역에 배포합니다. 한 노드 또는 영역에 장애가 발생해도 데이터를 계속 사용할 수 있습니다.
관련 정보
Amazon OpenSearch Service의 운영 모범 사례
OpenSearch Service 도메인의 내결함성을 개선하려면 어떻게 해야 합니까?
OpenSearch Service 도메인을 스케일 업 또는 스케일 아웃하려면 어떻게 해야 합니까?
OpenSearch Service 도메인이 상태로 멈춘 이유는 무엇인가요?"Modifying"