スキップしてコンテンツを表示

Amazon Aurora PostgreSQL 互換クラスターがフェイルオーバーした原因を教えてください。

所要時間2分
0

Amazon Aurora PostgreSQL 互換エディションデータベース (DB) クラスターでフェイルオーバーイベントが発生する原因を知りたいです。

簡単な説明

次のいずれかのイベントが発生すると、Aurora PostgreSQL 互換は自動的にリーダーインスタンスへフェイルオーバーします。

  • ライターインスタンスにインフラストラクチャーの問題がある。これには、物理ホストまたはクラスターのボリュームへのネットワーク接続の喪失、または物理コンピューティングリソースの問題が含まれます。
  • ライターインスタンスにアクセスできない。この問題は、パフォーマンスのボトルネックやリソースの競合の原因となる過剰なワークロードがある場合に発生します。
  • DB インスタンスの垂直スケーリングにより、ライターの DB インスタンスクラスタイプが変更された。
  • ライターの基盤となるホストで、特定のメンテナンス期間中に、ソフトウェアのパッチ適用、ハードウェアのメンテナンス、オペレーティングシステム (OS) の更新のいずれかが行われた。詳細については、「Amazon Aurora DB クラスターのメンテナンス」を参照してください。
  • インスタンスはインスタンスレベルでフェイルオーバーオプションを使用します。

解決策

クラスターのライターがヘルスチェックに応答しない場合、クラスターは優先度に基づいていずれかのリーダーへのフェイルオーバーを開始します。フェイルオーバーの原因を特定するには、Aurora PostgreSQL 互換クラスターの次のログとメトリクスを確認してください。

Amazon RDS イベント

予期しない停止の原因を特定するには、フェイルオーバー期間中のすべての Aurora イベントを表示します。過去 2 週間までのイベントを表示できます。イベントを長期間保存するには、Aurora イベントを Amazon EventBridge に送信します。詳細については、「Amazon Aurora イベントでトリガーするルールの作成」を参照してください。

CloudWatch メトリクス

DB の負荷が高いことがフェイルオーバーの原因になっているかどうかを確認するには、Amazon CloudWatch を使用して Aurora DB クラスターのメトリクスを表示します。

クラスターの可用性とヘルスステータスを示す以下のメトリクスが急上昇していないか確認してください。

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth
  • StorageNetworkThroughput

拡張モニタリング

拡張モニタリングを使用すると、リアルタイムで OS メトリクスを表示できます。Amazon Aurora インスタンスの拡張モニタリングを有効にするには、「Setting up and turning on Enhanced Monitoring」(拡張モニタリングの設定と有効化) を参照してください。表示できる OS メトリクスのリストについては、「拡張モニタリングの OS メトリクス」を参照してください。

Performance Insights

Performance Insights を使用して、Aurora PostgreSQL 互換クラスターの DB 負荷を表示します。待機、SQL ステートメント、ホスト、またはユーザー別に負荷をフィルタリングできます。詳細については、「Performance Insights ダッシュボードを使用してメトリクスを分析する」を参照してください。

Performance Insights には、DB 負荷の 99% を使用するクエリなど、DB 負荷に占める割合が最も高いクエリが表示されます。

Performance Insights は、次の問題が DB クラスターのパフォーマンスに影響する可能性があるかどうかを特定するのに役立ちます。

  • ディスク読み取り用の IO:DataFileRead などの I/O オペレーション
  • Lock:transactionidLock:Relation などのロック競合
  • BufferPin:BufferPin などのバッファ管理上の問題
  • Client:ClientReadClient:ClientWrite などのクライアント通信の遅延

重要: 2026 年 6 月 30 日に Performance Insights のサポートは終了します。2026 年 6 月 30 日までに、Database Insights のアドバンストモードにアップグレードしてください。アップグレードしない場合、Performance Insights を使用する DB クラスターは、デフォルトで Database Insights のスタンダードモードを使用します。実行計画とオンデマンド分析は、Database Insights のアドバンストモードでのみサポートされます。クラスターがデフォルト設定によりスタンダードモードになった場合、コンソールでこれらの機能を使用できない可能性があります。アドバンストモードの有効化方法については、「Turning on the Advanced mode of Database Insights for Amazon RDS」(Amazon RDS で Database Insights のアドバンストモードを有効にする) を参照してください。また、「Amazon Aurora で Database Insights のアドバンストモードを有効にする」を参照してください。

Aurora DB ログ

オンプレミスのデータベースでは、DB ログはファイルシステムに存在します。ファイルシステム上の DB ログがあるホストにはアクセスできないため、代わりに Amazon CloudWatch Logs にログを公開してください。

Amazon RDS コンソールを使用して DB ログファイルを監視することもできます。

Aurora PostgreSQL による高速フェイルオーバー

フェイルオーバー後に正常なレプリカインスタンスに迅速にオペレーションを切り替えるには、アプリケーションで高速フェイルオーバー用に設定します。

Aurora PostgreSQL 互換のクラスターキャッシュ管理によるフェイルオーバー後の高速リカバリ

DB クラスター内の DB インスタンスを迅速に復旧するには、Aurora PostgreSQL 互換のクラスターキャッシュ管理を使用してください。

フェイルオーバーのパフォーマンスを向上させる RDS Proxy

Amazon RDS Proxy を使用して DB インスタンスへ接続するためのプールを維持します。データベースのフェイルオーバー中も、RDS Proxy は同じ IP アドレスでの接続を引き続き受け入れ、接続を新しいプライマリ DB インスタンスに自動的に転送します。元の DB インスタンスが使用できなくなると、RDS Proxy はスタンバイデータベースに接続しますが、アイドル状態のアプリケーション接続は切断しません。

関連情報

Amazon Aurora の高可用性

Amazon Aurora クラスターでのメトリクスのモニタリング

Aurora の Amazon RDS イベントカテゴリとイベントメッセージ

AWS公式更新しました 5ヶ月前
コメントはありません

関連するコンテンツ