내 Amazon Elastic File System (Amazon EFS) 서버가 “fs: server 127.0.0.1 not responding”이라는 오류 메시지와 함께 응답하지 않습니다. 이 문제를 해결하고 싶습니다.
간략한 설명
다음과 같은 이유로 “server not responding” 오류가 표시될 수 있습니다.
- NFS 클라이언트는 Amazon EFS 서버에 연결할 수 없습니다.
- 인스턴스의 재부팅 또는 종료로 인해 네트워크 연결이 끊어졌습니다.
- 리소스가 과도하게 활용되고 있습니다.
- 네트워크 성능 문제로 인해 오류가 발생하고 있습니다.
- 특정 커널 버전에 문제가 있습니다.
- 잘못된 마운트 구성을 사용하고 있습니다.
사용 사례에 가장 적합한 솔루션 방법을 완성하세요.
해결 방법
NFS 클라이언트는 Amazon EFS 서버에 연결할 수 없습니다.
NFS 클라이언트가 Amazon EFS 서버에 연결할 수 없는 경우 네트워크 구성에서 잘못된 보안 그룹 설정, DNS 확인 문제 또는 VPC 구성 등의 문제가 있는지 확인하세요.
연결을 확인하려면 다음 명령을 실행합니다.
telnet efs-mount-target-IP-address 2049
연결에 성공하면 출력에 지정된 포트 (EFS 마운트 대상 IP 주소) 에 대한 연결이 표시됩니다.
ec2-user@ip-172-31-8-105 ~
telnet 172.31.11.149 2049
Trying 172.31.11.149...
Connected to 172.31.11.149.
Escape character is '^'.
연결에 실패하면 다음 검사를 완료하세요.
- EFS 파일 시스템과 연결된 보안 그룹이 클라이언트 보안 그룹의 포트 2049에서 인바운드 트래픽을 허용하는지 확인하세요. 자세한 내용을 알아보려면 보안 그룹 생성을 참조하세요.
- DNS가 EFS 마운트 대상의 IP 주소를 확인할 수 있는지 확인합니다. 자세한 내용을 알아보려면 ](https://docs.aws.amazon.com/efs/latest/ug/mounting-fs-mount-cmd-dns-name.html)DNS 이름으로 Amazon EC2에 마운트하기[를 참조하세요.
인스턴스가 재부팅되거나 종료되었습니다.
재부팅 또는 종료가 발생했는지 확인하려면 Amazon CloudWatch의 StatusCheckFailed 지표에서 최근 인스턴스 중지 또는 재부팅을 검토하세요.
활용도가 높음
CPU 또는 메모리 사용량이 많으면 성능 문제가 발생할 수 있습니다. CPU 및 메모리 사용량을 확인하려면 atop과 같은 도구를 사용하세요. 자세한 내용을 알아보려면 디지털 오션 웹 사이트에서 Linux의 atop 명령 가이드를 참조하세요. 그런 다음 EC2 인스턴스에 대한 CloudWatch 지표 CPUUtilization을 검토하세요.
이 문제를 해결하려면 인스턴스를 더 큰 인스턴스 유형으로 업데이트하세요.
네트워크 성능 문제
CloudWatch 지표
네트워크 성능이 좋지 않으면 EFS 마운트 오류가 발생할 수 있습니다. 네트워크 성능을 모니터링하려면 다음 단계를 완료하세요.
- CloudWatch 콘솔을 엽니다.
- EC2 인스턴스를 선택합니다.
- 지표 섹션의 EC2에서 다음 지표를 확인하세요.
네트워크 패킷 입력/출력: 패킷 속도의 편차가 크면 네트워크가 불안정해질 수 있습니다.
네트워크 입력/출력 바이트: 바이트 속도의 편차가 크면 네트워크가 불안정해질 수 있습니다.
네트워크 오류: 네트워크 오류가 증가하면 네트워크 인터페이스에 문제가 발생할 수 있습니다. 많은 네트워크 오류를 해결하려면 인스턴스 유형을 네트워크 성능이 향상된 인스턴스 유형으로 변경하세요.
네트워크 처리량: 지속적으로 높은 처리량을 유지하면 더 높은 대역폭 인스턴스가 필요하다는 것을 알 수 있습니다.
기타 모니터링 도구
Die Net 웹 사이트에서 sar, nload 및 iftop와 같은 타사 도구를 사용할 수도 있습니다.
마이크로 버스팅 식별 및 완화
마이크로 버스팅은 네트워크 트래픽이 잠깐 급증하여 패킷 손실과 잠재적 오류로 이어질 수 있기 때문에 갑자기 성능이 저하될 수 있습니다. 마이크로 버스팅을 식별하고 완화하려면 다음 단계를 완료하세요.
- CloudWatch 콘솔을 엽니다.
- EC2 인스턴스를 선택합니다.
- 모니터링을 선택하고 다음 지표를 검토하세요.
네트워크 입력/출력: 들어오고 나가는 네트워크 트래픽의 양을 모니터링합니다.
네트워크 패킷 입력/출력: 짧은 간격으로 전송하거나 수신한 패킷 수가 갑자기 급증하지 않는지 확인합니다.
CPU 크레딧 사용량 및 CPU 크레딧 밸런스: 인스턴스에 네트워크 성능 문제와 관련된 CPU 제한이 있는지 확인합니다.
참고: 네트워크 트래픽이나 패킷 속도가 갑자기 증가하면 마이크로 버스팅이 발생할 수 있습니다. 시간이 지남에 따라 이러한 지표를 모니터링하여 일시적인 급증 패턴을 식별하는 것이 가장 좋습니다.
수집한 데이터를 사용하여 네트워크 트래픽 또는 패킷 수가 짧고 갑자기 증가하는지 찾아보세요. 마이크로 버스팅이 확인되면 다음 단계를 완료하세요.
자세한 내용을 보려면 Amazon EBS 볼륨이 마이크로 버스팅 상태인지 식별하여 이러한 상황이 발생하지 않도록 하려면 어떻게 해야 하나요?를 참조하세요.
커널 버전 문제 해결
일부 커널 버전에는 EFS 마운트 실패를 일으킬 수 있는 문제가 있습니다.
커널 버전을 확인하려면 다음 명령을 실행합니다.
uname -r
다음과 같은 출력이 나타납니다.
6.1.97-104.177.amzn2023.x86_64
커널 버전 4.3 이상을 사용하고 있는지 확인하세요.
잘못된 마운트 구성
잘못된 마운트 옵션을 사용하면 마운트가 실패합니다.
마운트 옵션을 확인하려면 사용된 mount 명령을 확인하세요. 파일 시스템을 마운트할 때는 noresvport 옵션을 포함해야 합니다.
sudo mount -t nfs -o nfsvers=4.1,rsize=1048576,wsize=1048576,hard,timeo=600,retrans=2,noresvport <mount-target-ip>:/ <mount-point>
마운트 옵션에 대한 자세한 내용을 알아보려면 권장 NFS 마운트 설정을 참조하세요.
올바른 마운트 구성을 사용하고 있지만 실패하는 경우 로그 정보를 수집하고 AWS Support에 문의하세요.