為什麼我的 Amazon Aurora PostgreSQL 相容版本叢集發生容錯移轉?

1 分的閱讀內容
0

我想知道是什麼原因導致我的 Amazon Aurora PostgreSQL 相容版本資料庫叢集發生容錯移轉。

簡短說明

在下列情況下,Aurora PostgreSQL 相容版本會自動對執行個體執行容錯移轉,移轉至其中一個叢集讀取器:

  • 寫入器執行個體發生基礎架構問題。這包括中斷與實體主機的網路連線、中斷與叢集磁碟區的網路連線,或實體運算資源發生問題。
  • 無法與寫入器執行個體連線。這個問題與工作負載過多有關,導致效能瓶頸和資源爭用等問題。
  • 寫入器的資料庫執行個體類別類型隨著資料庫執行個體垂直擴展活動的一部分而變更。
  • Aurora 寫入器執行個體的基礎主機正在特定維護時段進行軟體修補、硬體維護,或是作業系統 (OS) 更新。如需詳細資訊,請參閱維護 Amazon Aurora 資料庫叢集
  • 執行個體在執行個體層級使用容錯移轉選項進行容錯移轉。

當叢集的寫入器無法回應運作狀態檢查時,叢集會根據其指定的優先順序啟動容錯移轉,移轉至其中一個叢集讀取器。如需詳細資訊,請參閱 Failover with Amazon Aurora PostgreSQL (Amazon Aurora PostgreSQL 的容錯移轉)。

解決方案

若要找出容錯移轉背後的原因,請查看以下 Aurora PostgreSQL 相容版本之叢集的日誌和指標。

Amazon RDS 事件

若要找出意外中斷的根本原因,請檢視容錯移轉期間內的所有 Amazon Relational Database Service (Amazon RDS) 事件。預設情況下,所有事件都會以 UTC/GMT 時間註冊。若要讓事件存放更長的時間,請將 Amazon RDS 事件傳送至 Amazon CloudWatch Events。如需詳細資訊,請參閱建立由 Amazon Aurora 事件觸發的規則

Amazon CloudWatch 指標

檢視 Aurora PostgreSQL 相容版本之叢集的 Amazon CloudWatch 指標,以查看是否為資料庫負載過高導致服務中斷。如需詳細資訊,請參閱使用 Amazon CloudWatch 監控 Amazon Aurora 指標。檢查指出叢集/執行個體可用性和運作狀態的下列關鍵指標中是否出現峰值:

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth

增強型監控

若要開啟 Amazon Aurora 執行個體的增強型監控功能,請參閱 Setting up and turning on Enhanced Monitoring (設定和開啟增強型監控)。

Amazon RDS 會提供您執行資料庫執行個體之 OS 的即時指標。您可以使用主控台來檢視 PostgreSQL 執行個體的所有系統指標和處理資訊。您可以管理要監控每個執行個體的哪些指標,然後根據您的需求自訂儀表板。如需增強型監控指標的說明,請參閱 OS metrics in Enhanced Monitoring (增強型監控的 OS 指標)。

績效詳情

績效詳情可擴展現有的 Amazon Aurora 監控功能,以說明和協助您分析叢集效能。使用績效詳情儀表板可以用視覺化方式呈現 Aurora PostgreSQL 相容版本之叢集負載的資料庫負載。您可以按等候、SQL 陳述式、主機或使用者來篩選負載。

如需詳細資訊,請參閱在 Amazon Aurora 上使用績效詳情監控資料庫負載以及使用績效詳情儀表板來分析指標

Aurora 資料庫日誌

在內部部署資料庫中,資料庫日誌存放於檔案系統上。Amazon RDS 和 Amazon Aurora 不允許主機存取 Aurora PostgreSQL 相容版本之叢集的檔案系統上的資料庫日誌。您可以使用 Amazon CloudWatch Logs 來分析日誌資料。如需詳細資訊,請參閱將 Aurora PostgreSQL 日誌發佈至 Amazon CloudWatch Logs

使用 AWS 管理主控台也可以監看日誌檔。如需詳細資訊,請參閱 Watching a database log file (監看資料庫日誌檔)。

Amazon Aurora PostgreSQL 相容版本的快速容錯移轉

為了確保在資料庫叢集中盡快進行容錯移轉,請參閱 Amazon Aurora PostgreSQL 的快速容錯移轉

Aurora PostgreSQL 相容版本的容錯移轉後使用叢集快取管理快速復原

為了確保寫入器資料庫執行個體在容錯移轉後能夠快速復原,請參閱 Aurora PostgreSQL 的容錯移轉後使用叢集快取管理快速復原


相關資訊

Amazon Aurora 的高可用性

監控 Amazon Aurora 叢集中的指標

Amazon RDS 事件類別和事件訊息

AWS 官方
AWS 官方已更新 2 年前