내용으로 건너뛰기

OpenSearch Service 노드에 충돌이 발생한 이유는 무엇입니까?

3분 분량
0

Amazon OpenSearch Service 클러스터의 노드 중 하나가 다운되었습니다. 또는 OpenSearch Service 노드가 계속 충돌합니다.

해결 방법

Java 가상 머신(JVM) 압력이 높거나 CPU 사용량이 많으면 노드에 과부하가 걸리므로 클러스터 노드가 실패할 수 있습니다. 하드웨어 장애로 인해 상태 확인에 실패한 경우에도 클러스터 노드 오류가 발생합니다.

실패한 노드 확인

다음 단계를 완료하십시오.

  1. OpenSearch Service 콘솔을 엽니다.
  2. 탐색 창의 관리형 클러스터에서 도메인을 선택합니다.
  3. OpenSearch Service 도메인을 선택합니다.
  4. 클러스터 상태 탭을 선택한 다음, 노드를 선택합니다. 노드 수가 클러스터에 구성한 수보다 적으면 노드가 다운된 것입니다.
    참고: 클러스터 구성을 변경하거나 서비스를 정기적으로 유지 관리하는 동안 노드 지표가 정확하지 않을 수 있습니다. 이는 예상된 동작입니다.

과부하된 노드 식별 및 문제 해결

CPU 및 JVM 압력이 높으면 트래픽이 많기 때문에 클러스터에서 노드가 삭제될 수 있습니다. 노드가 부하를 관리할 수 없는 경우 응답하지 않고 충돌이 발생할 수 있습니다.

이 문제를 해결하려면 노드를 재부팅하십시오. 노드 재부팅 요구 사항을 준수해야 합니다.

그래도 문제가 발생하면 OpenSearch Service 클러스터의 CPU 사용률JVM 메모리 압력을 확인하고 줄이십시오.

하드웨어 장애 문제 식별 및 문제 해결

하드웨어 장애는 클러스터 노드의 가용성에 영향을 미칠 수 있습니다. OpenSearch Service는 각 노드에서 주기적인 상태 확인을 수행합니다. 노드가 상태 확인에 실패하면 OpenSearch Service에서 해당 노드가 클러스터에 다시 조인하거나 자동으로 새 정상 노드로 교체할 수 있습니다.

복제를 사용하여 데이터 손실 위험 줄이기

다음 명령을 실행하여 OpenSearch Service에서 충돌이 발생한 노드를 대체하는 경우에 인덱스 복제본을 백업으로 사용할 수 있도록 활성화합니다.

curl -XPUT 'domain-endpoint/indexname/_settings' -H 'Content-Type: application/json' -d'{ "index" : { "number_of_replicas" : 0 }}

참고: domain-endpoint를 도메인 엔드포인트로 바꾸고 indexname을 인덱스 이름으로 바꾸십시오.

복제본 샤드는 데이터 중복성을 제공하고 기본 샤드를 사용할 수 없게 되더라도 클러스터가 요청을 계속 처리할 수 있도록 합니다. 인덱스마다 하나 이상의 복제본을 구성하는 것이 가장 좋습니다. 복제본 샤드가 없는 다중 노드 클러스터는 데이터 손실 위험이 있습니다. 자세한 내용은 Amazon OpenSearch Service 도메인 크기 조정을 참조하십시오.

각 클러스터에서 데이터 노드를 두 개 이상 사용하는 것이 가장 좋습니다. 기본 샤드와 복제본 샤드를 동일한 노드에 할당할 수 없기 때문에 단일 노드 클러스터에는 복제본 샤드를 사용할 수 없습니다. 노드가 충돌하면 데이터 손실이 발생합니다. 이는 클러스터에 대해 세분화된 액세스 제어를 활성화한 경우에도 발생합니다. 단일 노드 클러스터가 충돌하는 경우 인덱스 스냅샷을 사용하여 손실된 데이터를 복원하십시오.

중요: 최신 스냅샷에서 캡처한 데이터만 복구할 수 있습니다.

다중 AZ 도메인 구성

다중 AZ 도메인을 구성할 때 OpenSearch Service는 여러 가용 영역에서 데이터 노드를 시작합니다. OpenSearch Service는 기본 샤드와 해당 복제본 샤드를 여러 가용 영역에 배포합니다. 한 노드 또는 영역에 장애가 발생해도 데이터를 계속 사용할 수 있습니다.

관련 정보

Amazon OpenSearch Service의 운영 모범 사례

OpenSearch Service 도메인의 내결함성을 개선하려면 어떻게 해야 합니까?

OpenSearch Service 도메인을 스케일 업 또는 스케일 아웃하려면 어떻게 해야 합니까?

OpenSearch Service 도메인이 상태로 멈춘 이유는 무엇인가요?"Modifying"

AWS 공식업데이트됨 9달 전