Amazon Kinesis 데이터 스트림 500 내부 서버 오류 또는 503 서비스를 사용할 수 없음 오류 문제를 해결하고 싶습니다.
간략한 설명
Kinesis 데이터 스트림을 생성할 때 다음과 같은 내부 오류가 발생할 수 있습니다.
- PutRecord 또는 PutRecords가 몇 분 동안 1%를 넘는 비율로 AmazonKinesisException 500 또는 AmazonKinesisException 503 오류 반환
- SubscribeToShard.Success 또는 GetRecords가 몇 분 동안 1%를 넘는 비율로 AmazonKinesisException 500 또는 AmazonKinesisException 503 오류 반환
이러한 내부 오류를 해결하려면 다음 단계를 완료하세요.
- 오류율을 계산합니다.
- 재시도 메커니즘을 구현합니다.
해결 방법
오류율 계산
PutRecord.Success 또는 GetRecord.Success의 시간 창이 대폭 하락했는지 확인합니다. 모니터링 탭에서 이러한 지표를 검토할 수 있습니다. 크게 하락한 경우 오류율을 계산하여 Kinesis 데이터 스트림 문제의 심각도를 확인합니다.
오류율을 계산하려면 PutRecord.Success 및 GetRecord.Success의 평균값을 계산합니다.
재시도 메커니즘 구현
오류율이 0.1% 미만으로 떨어지는지 확인합니다. Kinesis 데이터 스트림을 사용하면 오류율이 낮으면서 높은 처리량의 쓰기가 가능합니다. 평균 오류율은 일반적으로 0.01% 미만입니다.
자체 소비자 또는 생산자를 작성한 경우 애플리케이션 코드에 재시도 메커니즘을 구현합니다. 재시도 메커니즘 구현에 대한 자세한 내용은 Amazon Kinesis Producer Library를 사용한 효율적이고 안정적인 프로듀서 구현의 재시도 섹션을 참조하세요.
몇 분 동안 오류율이 1%를 초과하면 AWS Support에 문의하세요. 커뮤니케이션에 다음 정보를 포함하세요.
- 데이터 스트림에서 데이터를 읽거나 쓰는 데 사용되는 애플리케이션
- Kinesis 데이터 스트림의 샤드 수
- 서버 측 암호화 설정
- 영향을 받는 특정 샤드 ID
- 성공률 저하가 관찰되는 기간
- 내부 장애를 보고하는 요청 ID
관련 정보
Amazon Kinesis Producer Library를 사용하여 프로듀서 개발
KCL 2.x 소비자 개발