システムステータスのチェックに失敗した場合、どのような対応をしていますか

0

こんにちは。いつもお世話になっております。
EC2インスタンスのハードウェア障害時の対応についてお聞きしたいです。

スタンドアロンなEC2を 夜間に自動で停止(stop)、翌朝に自動で起動(start)という運用をしています。先日、自動起動に失敗をしたのでEC2のstop/startをしました。完全な停止状態になるまでに40分間くらいかかってしまいました。システムのステータスチェックに失敗した場合、完全stopまでに30分以上かかることが多く、皆さまがどうやってこの障害を回避しているのか知りたいと思いました。

ステータスが失敗したらバックアップAMIから新規インスタンスを起動してEIPを付け替えるような対応って皆さん各自で取られているのでしょうか。何かいい方法があったらご教授いただけませんでしょうか。(Loadbalancerでスタンドアロンなec2運用をしたりって、できませんよね。)

i-0ec9cda350d904b83
4/25 08:30JST頃の自動起動時にシステムステータスのチェックに失敗

질문됨 6년 전140회 조회
1개 답변
0

「自動起動に失敗」の状況、稼働するアプリケーション、システムが確保しなければいけない稼働時間の水準などによって対応方法は異なると思います。
なんとなく以下のような設計の必要は感じました。

http://aws.clouddesignpattern.org/index.php/CDP:Server_Swappingパターン

semnil
답변함 6년 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인