Amazon OpenSearch Service のソフトウェア更新中のダウンタイムと問題のトラブルシューティング方法について知りたいと考えています。
簡単な説明
Amazon OpenSearch Service は、機能追加またはドメイン強化を行うサービスソフトウェア更新を定期的にリリースしています。
OpenSearch ソフトウェアアップデートに関する最も一般的な問題は以下のとおりです。
- ダウンタイム
- ドメイン資格
- データ損失
- ソフトウェア更新の重要度
- サービスソフトウェア更新に必要な推定時間
- ソフトウェアの手動アップデート
- 更新をキャンセルする
**注:**サービスソフトウェアの更新は OpenSearch のバージョンアップグレードとは異なります。詳細については、「Amazon OpenSearch Service ドメインのアップグレード」を参照してください。
解決策
ダウンタイム
OpenSearch Service のソフトウェア更新では、ブルー/グリーンデプロイを使用してダウンタイムを最小限に抑え、デプロイが失敗した場合でも元の環境を維持します。
更新は通常数分以内に完了しますが、システムの負荷が高い場合は数時間から数日かかることがあります。
**注:**OpenSearch ダッシュボードは、一部またはすべての更新中に利用できなくなる場合があります。
サービスソフトウェア更新のダウンタイムを減らすには、以下のベストプラクティスに従ってください。
- 1 回の変更リクエストで構成変更を実行します。これにより、ブルー/グリーンデプロイが 1 回実行されます。
- ドメインのトラフィックをできるだけ少なくしてください。
- 更新期間が長くなるのを避けるため、設定したオフピーク期間中にドメインを更新してください。
- 構成変更を実行するときは、クラスターが正常でアクティブな状態であることを確認してください。
- リソース使用率がしきい値内であり、最適な状態にあることを確認してください。
- クラスターに専用のプライマリノードがある場合、アップグレードはダウンタイムなしで完了します。クラスターに専用のプライマリノードがない場合、アップグレード後、プライマリノードを選択する際にクラスターが数秒間応答しなくなることがあります。
アラート
OpenSearch Service は、サービスソフトウェアの更新が利用可能になったとき、必要なとき、開始したとき、完了したとき、または失敗したときに通知を送信します。また、予定日の 2 週間前に、OpenSearch は AWS アカウントに登録されているメールアドレスに通知メールを送信します。必要な更新を行わない場合でも、OpenSearch Service は一定期間 (通常は 2 週間) が経過すると、ドメインサービスソフトウェアを自動的に更新します。OpenSearch Service は、更新の開始時と完了時に通知を送信します。詳細については、「Amazon OpenSearch Service の通知」を参照してください。
**注:**手動で更新を開始した場合、OpenSearch Service は更新の開始時に通知を送信しません。OpenSearch サービスは、更新が完了したときにのみ通知を送信します。
ドメイン資格
サービスソフトウェアの更新を実行するには、ドメインが適格な状態にある必要があります。更新の対象とならない状態の一覧については、「ドメインが更新の対象外となる場合」を参照してください。
ドメインの適格性をプログラムで確認するには、以下の AWS コマンドラインインターフェイス (AWS CLI) コマンドを実行します。
aws es —region region_name upgrade-elasticsearch-domain —domain-name domain_name —target-version OpenSearch_1.1 —perform-check-only
注: AWS CLI コマンドの実行中にエラーが発生した場合は、最新バージョンの AWS CLI を使用していることを確認してください。
データ損失
OpenSearch Service は、データ損失の際に、自動スナップショットを作成してデータをバックアップします。クラスターの状態が赤になった場合やデータ損失の場合に、スナップショットを使用してドメインを復元できます。詳細については、「スナップショットの復元」を参照してください。
データをプロアクティブにバックアップするには、ドメインのスナップショットを手動で取得できます。詳細については、「Amazon OpenSearch Service でのインデックススナップショットの作成」を参照してください。
**ロールバック **
サービスアップデートが正常に適用されると、ロールバックを実行することはできません。サービスアップデートが停止した場合は、AWS サポートに連絡してください。
ソフトウェア更新の重要度
更新があるかどうかの確認や、更新のステータスの確認には、OpenSearch Service コンソールを開きます。ナビゲーションペインで、 [通知] を選択します。クラスターのアップグレードのモニタリングの詳細については、「Amazon OpenSearch Serviceドメインの更新に時間がかかっているのはなぜですか?」を参照してください。
各通知には、サービスソフトウェア更新の重要度など、サービスソフトウェア更新に関する詳細が含まれています。サービスソフトウェア更新は、オプションまたは必須に分類されます。
通知の重要度が、「情報」、「低」または「中」の場合、更新は任意です。オプションの更新は手動で実行する必要があります。
通知の重要度が、「高」または「重要」の場合は、更新が必要です。OpenSearch Service は必要な更新を自動的に実行します。ドメインのオフピーク期間内であれば、OpenSearch Service は指定された期限 (通常は利用可能になってから 14 日後) を超えていつでもアップデートを開始できます。
サービスソフトウェア更新に必要な推定時間
サービスソフトウェアの更新期間は、以下の要因によって異なる場合があります。
- ドメイン設定
- ノード数
- シャードデータ
- 更新時にクラスターが処理中であることに対する継続的なロードまたはリクエスト。
更新はクラスター専用のプライマリノードに一時的に負荷がかかる可能性があるため、ベストプラクティスとして、クラスターの負荷が少ないときに更新をインストールしてください。オフピーク時間帯にソフトウェア更新をスケジュールして、クラスター専用のプライマリノードへの負担を最小限に抑えることができます。また、カスタムのオフピーク期間を設定して 、ソフトウェア更新の開始時間を変更することもできます。
更新をスケジュールするもう 1 つの方法は、ブルー/グリーンデプロイを実行する設定変更を開始することです。ブルー/グリーンデプロイを実行すると、サービスソフトウェアの更新とともに構成も実行されます。たとえば、任意の量のストレージを追加すると、すぐにブルー/グリーンデプロイが実行されます。
ソフトウェアの手動アップデート
ドメインを手動で更新すると、新機能をより早く利用できます。ドメインを手動で更新する手順については、「サービスソフトウェアの更新の開始」を参照してください。
更新をキャンセルする
ソフトウェアの更新をキャンセルするには、AWS CLI のcancel-service-software-updateコマンドを実行します。
cancel-service-software-updateコマンドは、OpenSearch Service ドメインのスケジュールされたサービスソフトウェア更新をキャンセルします。この操作を実行できるのは、UpdateStatusが PENDING_UPDATE 状態で、AutomatedUpdateDateより前の場合だけです。