スキップしてコンテンツを表示

今年に入ってから3回もEC2の再起動または負荷が上がった状態でアクセスできない。

0

同じEC2では起きてないですが、今年に入ってから3回もEC2の再起動または負荷が上がった状態がありました。 本日の場合は夜中の0時あたりにCPU負荷は高い、ネットワーク受信はない状況でした。 今回はSSH接続もできなくて「EC2 シリアルコンソール」でアクセスしても真っ黒で何も確認できない状況でした。

・ステータスとアラーム インスタンスステータスのチェック ×インスタンスの接続性チェックに失敗しました

下記質問させてください。 ■質問1 上記のような状態が頻繁に発生しているように見えます。 EC2のメンテナンスなどで裏で切り替わったりするでしょうか。 何かメンテナンス作業が行っているのであれば詳細を教えてください。

■質問2 EC2のメンテナンスなどで裏で切り替わるなど操作がある前提になりますが、 この時にはOS停止・起動または再起動を行うことでしょうか。

■質問3 上記の質問1、質問2に当てはまらない場合はどのような可能性があるでしょうか。

質問済み 9ヶ月前165ビュー
2回答
0

ご質問いただいた EC2 インスタンスの問題について回答いたします。

■質問1 AWS が定期的に EC2 インスタンスに対して自動的なメンテナンスを行うことはありますが、通常はユーザーに事前通知があり、インスタンスが突然アクセス不能になるようなことはありません。Amazon Linux 2 などの OS アップデートは定期的にリリースされていますが、これらは自動的に適用されるわけではなく、ユーザーが明示的にアップデートを実行する必要があります。

■質問2 AWS が行うスケジュールされたメンテナンスの場合、通常は事前に通知があり、ホストの問題がある場合は「インスタンスの再起動」が必要になることがあります。ただし、これは頻繁に発生するものではなく、事前に AWS コンソールや通知で確認できます。

■質問3 他の可能性としては以下が考えられます:

  1. システムリソースの枯渇:CPU 負荷が高いとのことですので、アプリケーションやプロセスがリソースを過剰に消費している可能性があります。

  2. メモリ不足:高負荷時にメモリが不足し、システムが応答しなくなっている可能性があります。

  3. ディスク容量の問題:ディスク容量が不足すると、システムが不安定になることがあります。

  4. セキュリティソフトやバックグラウンドプロセス:定期的に実行されるバックアップやスキャンなどが深夜に実行され、リソースを消費している可能性があります。

  5. OS やアプリケーションのバグ:特定の条件下でシステムが不安定になる可能性があります。

対策としては、CloudWatch でメトリクスを詳細に監視し、問題発生時のログを確認することをお勧めします。また、EC2 Instance Connect を使用して接続性の問題を回避することも検討できます。インスタンスのサイズが適切かどうかも確認し、必要に応じてスケールアップすることも検討してください。
Sources
Install EC2 Instance Connect on your EC2 instances - Amazon Elastic Compute Cloud
Amazon Linux 2 version 2.0.20230504.1 release notes - Amazon Linux 2
Amazon Linux 2 version 2.0.20230719.0 release notes - Amazon Linux 2
Amazon Linux 2 version 2.0.20230530.0 release notes - Amazon Linux 2

回答済み 9ヶ月前
エキスパート
レビュー済み 9ヶ月前
0

質問に回答させていただきます。

質問1 上記のような状態が頻繁に発生しているように見えます。 EC2のメンテナンスなどで裏で切り替わったりするでしょうか。 何かメンテナンス作業が行っているのであれば詳細を教えてください。

AWS側でEC2メンテナンスなどは実施していないように思われます。

もしAWS側でEC2メンテナンスが実施される場合は下記URLに記載されているように事前通知があります。 https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/monitoring-instances-status-check_sched.html

質問2 EC2のメンテナンスなどで裏で切り替わるなど操作がある前提になりますが、 この時にはOS停止・起動または再起動を行うことでしょうか。

AWS側でEC2のメンテナンスが実施される場合もあります。AWS側で実施されるメンテナンスにはEC2の再起動などが代表的だと思います。

上述のとおり再起動などは頻繁に実施されず、事前通知があります。

質問3 上記の質問1、質問2に当てはまらない場合はどのような可能性があるでしょうか。

内部のプログラム的な問題かと思います。プログラムが処理される際に特定のプロセスで多くのメモリを消費していたりしてEC2のメモリ使用率があがりサーバがハングするなどが考えらえれます。

CloudWatchでどのメトリクスが上昇しているか、その時点のアプリケーションログなどを確認すると原因が解決できるかと思います。

回答済み 9ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。