インスタンスを停止するとOSが強制終了されている

0

最近作成したEC2インスタンスが表題の状態です。
・c5.large/Win2016 x2台
・t3.medium/Win2012R2 x1台

ブラウザ上のAWSコンソールから「停止」すると「stopping」になりますが、リモートデスクトップは接続されたままで(正常なサーバは即時リモートデスクトップが切断されます)しばらくするとリモートデスクトップが突然切れてAWSコンソール上も「stopped」になります。
その後、サーバを起動してリモートデスクトップでログオンすると「予期せぬシャットダウン」のダイアログが表示されている状況です。推測ですが、stoppingで一定時間経つと仮想マシン自体が電源OFFされているように感じています。

Windows上から「シャットダウン」すると上記の現象は起こりません。AWSコンソールも特に異常なく「stopped」に変わります。

3台はいずれも今回はじめて作成したNITRO世代インスタンスです。t2.micro等の旧世代インスタンスでは発生していませんでした。NITROだから?という可能性も考えていますが確証はありません。

Win2016の2台はIAMロールでEC2RoleforSSMの権限を付与したタイミングから頻度が下がったように感じていますが、感覚値50%程度で発生しています。Win2012R2は依然として予期せぬ~が毎回表示される状況です。

解決方法などアドバイスをいただきたく、よろしくお願いします。

mzen
asked 5 years ago293 views
10 Answers
0

なんらかのプロセス、サービスなどがシャットダウンを妨げて終了時の処理に時間がかかり、強制的にインスタンスを停止されている可能性が高いと考えられます。
イベントログの出力などを確認いただき、時間のかかっている原因を調査して解消する必要がありそうです。

また、インスタンスの強制停止までの時間は決まった値が公開されているものではなく、インスタンスタイプで異なる可能性もあったと認識しています。

semnil
answered 5 years ago
0

ありがとうございます。イベントログの件はうっかりしていました。後ほど確認してみます。
結果は後ほど追記いたします。

ただ、「スタートメニューからシャットダウン」では問題なく停止する点が引っ掛かっています。
AWSコンソールからのシャットダウンコマンドがOSに届いていないような、そんな印象を受けています。
他の方からの助言も引き続きお待ちしています。よろしくお願いします。

mzen
answered 5 years ago
0

イベントログを確認しましたが特に目立ったログはありませんでした。
ダメ元でSSMエージェントを最新化してみましたが状況は変わりませんでした。
残念です。

試しに新しいインスタンスを起動してみたところ、下記の状況がわかりました。
・同じVPCにt3.micro/2012R2 ⇒ 現象発生
・別のVPCにt3.micro/2012R2 ⇒ 現象発生せず

このVPCではVPNを使用していて、接続先からの指定で下記の静的ルーティングを行っています。
逆に言うと、違いといえばこれくらいです。
172.xx.xx.0/24 local(一応伏字にしています)
0.0.0.0/0   IGW
10.0.0.0/8   VGW
172.16.0.0/12 VGW
192.168.0.0/16 VGW

現状はスタートメニューからのシャットダウンでしのいでいます。
他に試してみるべきこと、見るべき場所があればご指摘ください。
(同じ現象にあたってる方いませんか?)

mzen
answered 5 years ago
0

同様のインスタンスを起動して試してみましたが、いただいた情報だけでは再現させることができませんでした。
EC2Config, SSM エージェントの状況について、ログを確認する事で何か手がかりがつかめるかもしれません。

https://dev.classmethod.jp/cloud/aws/ec2config-log/
https://docs.aws.amazon.com/ja_jp/systems-manager/latest/userguide/sysman-agent-logs-win.html

semnil
answered 5 years ago
0

業務が立て込んでしまって確認が遅くなりました。再現試験ありがとうございます。
ログの確認、時間をみて進めていきます。結果をまた返信で記載させていただきます。

mzen
answered 5 years ago
0

だいぶ立て込んでしまって時間が空いてしまいました。

EC2Config、SSMエージェントのログを確認しましたが、目立ったエラーはありませんでした。
本来であればテクニカルサポートでケースオープンしたいのですが諸事情で使えず。。
当面はWindows上からシャットダウンする運用で凌ぐことになりそうです。

進展があればこのトピックに追記しようと思います。
遅くなりましたが御礼方々ご報告まで。

mzen
answered 5 years ago
0

調査に進展があったので追記します。
都合により該当環境で試せていないのですが、AWSドキュメントからの情報のため確度が高いと考えています。
他の方のヒントになれば幸いです。

Nitroインスタンスを正常にシャットダウンさせるには下記の電源設定が必要とのことです。
コマンドプロンプト、またはPowerShellから実行です。

powercfg /setacvalueindex 381b4222-f694-41f0-9685-ff5bb260df2e 7516b95f-f776-4464-8c53-06167f40cc99 3c0bc021-c8a8-4e07-a973-6b14cbcb2b7e 0
powercfg /setacvalueindex 8c5e7fda-e8bf-4a96-9a85-a6e23a8c635c 7516b95f-f776-4464-8c53-06167f40cc99 3c0bc021-c8a8-4e07-a973-6b14cbcb2b7e 0
powercfg /setacvalueindex a1841308-3541-4fab-bc81-f71556f20b4a 7516b95f-f776-4464-8c53-06167f40cc99 3c0bc021-c8a8-4e07-a973-6b14cbcb2b7e 0

該当文献は下記です。Part6の電源設定の項目です。
※英語版にしか記載がありません
https://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/migrating-latest-types.html#power-management

2018.11.28以降のAMIでは上記設定がデフォルトとのことです。

本件、下記の記事にて情報を得られました。
この場をお借りして感謝いたします(まだ試せていませんが。。)
https://dev.classmethod.jp/cloud/aws/howto-nitro-windows-201812/

当方で発生した環境は現在開発チームの都合で手を入れづらく、早くても年明けの試行となります。
同様の事象に遭遇されている方、いらっしゃいましたら上記の結果を共有いただければ幸いです。

mzen
answered 5 years ago
0

進展があって何よりです。あまりお役に立てなくて申し訳ありませんでした。
また、貴重な情報ありがとうございます。

semnil
answered 5 years ago
0

semnilさん、アドバイスありがとうございました。おかげ様で見通しが立ちました。
後日また結果を共有させていただこうと思います。
今後ともよろしくお願いいたします。

mzen
answered 5 years ago
0

解決のご報告です。
先日追記した電源設定を実施したところ、発生サーバ3台すべてで現象が解消されました。
また、2018年12月以降に最新AMIで作成したサーバでは現象が生じていないことも書き添えておきます。

誰かのお役にたてば幸いです。

mzen
answered 5 years ago

You are not logged in. Log in to post an answer.

A good answer clearly answers the question and provides constructive feedback and encourages professional growth in the question asker.

Guidelines for Answering Questions