システムステータスのチェックに失敗した場合、どのような対応をしていますか

0

こんにちは。いつもお世話になっております。
EC2インスタンスのハードウェア障害時の対応についてお聞きしたいです。

スタンドアロンなEC2を 夜間に自動で停止(stop)、翌朝に自動で起動(start)という運用をしています。先日、自動起動に失敗をしたのでEC2のstop/startをしました。完全な停止状態になるまでに40分間くらいかかってしまいました。システムのステータスチェックに失敗した場合、完全stopまでに30分以上かかることが多く、皆さまがどうやってこの障害を回避しているのか知りたいと思いました。

ステータスが失敗したらバックアップAMIから新規インスタンスを起動してEIPを付け替えるような対応って皆さん各自で取られているのでしょうか。何かいい方法があったらご教授いただけませんでしょうか。(Loadbalancerでスタンドアロンなec2運用をしたりって、できませんよね。)

i-0ec9cda350d904b83
4/25 08:30JST頃の自動起動時にシステムステータスのチェックに失敗

gefragt vor 6 Jahren141 Aufrufe
1 Antwort
0

「自動起動に失敗」の状況、稼働するアプリケーション、システムが確保しなければいけない稼働時間の水準などによって対応方法は異なると思います。
なんとなく以下のような設計の必要は感じました。

http://aws.clouddesignpattern.org/index.php/CDP:Server_Swappingパターン

semnil
beantwortet vor 6 Jahren

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen