Amazon Redshift가 노드를 교체하는 원인과 클러스터에 미치는 영향을 파악하고 싶습니다.
간략한 설명
Amazon Redshift 클러스터 노드 교체는 하드웨어 결함 또는 하드웨어 성능 문제로 인해 발생하는 유지 관리 작업입니다. 노드 교체는 데이터베이스 연결을 일시적으로 중단하고 작업에 영향을 줄 수 있습니다. Amazon Redshift는 데이터 웨어하우스 클러스터가 정상 상태를 유지하고 신뢰할 수 있으며 원활하게 작동하도록 노드를 교체합니다.
해결 방법
하드웨어 장애
하드웨어 장애, 하드웨어 성능 문제 또는 잠재적 장애 위험으로 인해 Amazon Redshift가 노드를 교체할 수 있습니다. Amazon Redshift는 각 클러스터 노드 내의 하드웨어 구성 요소를 지속적으로 모니터링합니다. Amazon Redshift는 구성 요소 중 하나에서 문제를 감지하면 해당 노드를 교체합니다.
노드 교체는 하드웨어 구성 요소에 장애가 발생할 때 나타날 수 있는 데이터 손상을 방지하기 위한 예방 조치입니다. 그러나 클러스터가 노드 교체 후 노드 간에 데이터를 재배포하는 경우 일시적인 성능 문제가 발생할 수 있습니다.
예약된 유지 관리
클러스터의 신뢰성과 성능을 개선하기 위해 Amazon Redshift는 기본 유지 관리 기간 동안 시스템 업데이트를 수행하고, 패치를 적용하고, 하드웨어 구성 요소를 교체합니다.
클러스터 작업에 미치는 영향
Amazon Redshift가 노드를 교체할 때 성능에 영향을 미치는 일시적인 클러스터 노드 중단이 발생할 수 있습니다. 단일 노드 클러스터의 하드웨어 장애 클러스터 상태를 받는 경우 노드를 교체할 수 없습니다. 대신 스냅샷에서 복원해야 합니다. 자세한 내용은 Amazon Redshift 스냅샷 및 백업을 참조하십시오.
노드 교체 모범 사례
노드 교체가 데이터베이스 작업에 미치는 영향을 최소화하려면 다음 모범 사례를 사용하십시오.
- 노드 교체를 야기할 수 있는 유지 관리 기간 또는 하드웨어 문제를 알리는 Amazon Redshift 이벤트 알림을 검토하고 이에 따라 작업을 계획하십시오.
- 사용량이 낮은 시간이나 데이터베이스 활동이 적은 기간에 유지 관리가 실행되도록 클러스터의 유지 관리 기간을 연기할 수 있습니다.
- 애플리케이션에 재시도 메커니즘을 구축하십시오. 재시도 메커니즘은 노드 교체 중 일시적인 연결 손실이나 성능 저하를 처리하므로 노드 교체가 완료된 후 애플리케이션이 복구되고 작동할 수 있습니다. 모든 AWS SDK에는 지수 백오프를 사용하는 알고리즘을 갖춘 재시도 메커니즘이 내장되어 있습니다.
- 다중 노드 클러스터는 단일 노드 클러스터보다 우수한 내결함성과 가용성을 제공하므로 프로덕션 워크로드에 다중 노드 클러스터를 사용하십시오.
관련 정보
Amazon Redshift의 클러스터 및 노드
Amazon Redshift에서 프로비저닝한 클러스터 이벤트 알림
Amazon Redshift에서 프로비저닝한 클러스터 사용 시 고려 사항