システムステータスのチェックに失敗した場合、どのような対応をしていますか

0

こんにちは。いつもお世話になっております。
EC2インスタンスのハードウェア障害時の対応についてお聞きしたいです。

スタンドアロンなEC2を 夜間に自動で停止(stop)、翌朝に自動で起動(start)という運用をしています。先日、自動起動に失敗をしたのでEC2のstop/startをしました。完全な停止状態になるまでに40分間くらいかかってしまいました。システムのステータスチェックに失敗した場合、完全stopまでに30分以上かかることが多く、皆さまがどうやってこの障害を回避しているのか知りたいと思いました。

ステータスが失敗したらバックアップAMIから新規インスタンスを起動してEIPを付け替えるような対応って皆さん各自で取られているのでしょうか。何かいい方法があったらご教授いただけませんでしょうか。(Loadbalancerでスタンドアロンなec2運用をしたりって、できませんよね。)

i-0ec9cda350d904b83
4/25 08:30JST頃の自動起動時にシステムステータスのチェックに失敗

質問済み 6年前90ビュー
1回答
0

「自動起動に失敗」の状況、稼働するアプリケーション、システムが確保しなければいけない稼働時間の水準などによって対応方法は異なると思います。
なんとなく以下のような設計の必要は感じました。

http://aws.clouddesignpattern.org/index.php/CDP:Server_Swappingパターン

semnil
回答済み 6年前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン

関連するコンテンツ