システムステータスのチェックに失敗した場合、どのような対応をしていますか

0

こんにちは。いつもお世話になっております。
EC2インスタンスのハードウェア障害時の対応についてお聞きしたいです。

スタンドアロンなEC2を 夜間に自動で停止(stop)、翌朝に自動で起動(start)という運用をしています。先日、自動起動に失敗をしたのでEC2のstop/startをしました。完全な停止状態になるまでに40分間くらいかかってしまいました。システムのステータスチェックに失敗した場合、完全stopまでに30分以上かかることが多く、皆さまがどうやってこの障害を回避しているのか知りたいと思いました。

ステータスが失敗したらバックアップAMIから新規インスタンスを起動してEIPを付け替えるような対応って皆さん各自で取られているのでしょうか。何かいい方法があったらご教授いただけませんでしょうか。(Loadbalancerでスタンドアロンなec2運用をしたりって、できませんよね。)

i-0ec9cda350d904b83
4/25 08:30JST頃の自動起動時にシステムステータスのチェックに失敗

已提问 6 年前140 查看次数
1 回答
0

「自動起動に失敗」の状況、稼働するアプリケーション、システムが確保しなければいけない稼働時間の水準などによって対応方法は異なると思います。
なんとなく以下のような設計の必要は感じました。

http://aws.clouddesignpattern.org/index.php/CDP:Server_Swappingパターン

semnil
已回答 6 年前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则