我想知道是什麼原因導致我的 Amazon Aurora PostgreSQL 相容版本資料庫叢集發生容錯移轉。
在下列情況下,Aurora PostgreSQL 相容版本會自動對執行個體執行容錯移轉,移轉至其中一個叢集讀取器:
當叢集的寫入器無法回應運作狀態檢查時,叢集會根據其指定的優先順序啟動容錯移轉,移轉至其中一個叢集讀取器。如需詳細資訊,請參閱 Failover with Amazon Aurora PostgreSQL (Amazon Aurora PostgreSQL 的容錯移轉)。
若要找出容錯移轉背後的原因,請查看以下 Aurora PostgreSQL 相容版本之叢集的日誌和指標。
若要找出意外中斷的根本原因,請檢視容錯移轉期間內的所有 Amazon Relational Database Service (Amazon RDS) 事件。預設情況下,所有事件都會以 UTC/GMT 時間註冊。若要讓事件存放更長的時間,請將 Amazon RDS 事件傳送至 Amazon CloudWatch Events。如需詳細資訊,請參閱建立由 Amazon Aurora 事件觸發的規則。
檢視 Aurora PostgreSQL 相容版本之叢集的 Amazon CloudWatch 指標,以查看是否為資料庫負載過高導致服務中斷。如需詳細資訊,請參閱使用 Amazon CloudWatch 監控 Amazon Aurora 指標。檢查指出叢集/執行個體可用性和運作狀態的下列關鍵指標中是否出現峰值:
若要開啟 Amazon Aurora 執行個體的增強型監控功能,請參閱 Setting up and turning on Enhanced Monitoring (設定和開啟增強型監控)。
Amazon RDS 會提供您執行資料庫執行個體之 OS 的即時指標。您可以使用主控台來檢視 PostgreSQL 執行個體的所有系統指標和處理資訊。您可以管理要監控每個執行個體的哪些指標,然後根據您的需求自訂儀表板。如需增強型監控指標的說明,請參閱 OS metrics in Enhanced Monitoring (增強型監控的 OS 指標)。
績效詳情可擴展現有的 Amazon Aurora 監控功能,以說明和協助您分析叢集效能。使用績效詳情儀表板可以用視覺化方式呈現 Aurora PostgreSQL 相容版本之叢集負載的資料庫負載。您可以按等候、SQL 陳述式、主機或使用者來篩選負載。
如需詳細資訊,請參閱在 Amazon Aurora 上使用績效詳情監控資料庫負載以及使用績效詳情儀表板來分析指標。
在內部部署資料庫中,資料庫日誌存放於檔案系統上。Amazon RDS 和 Amazon Aurora 不允許主機存取 Aurora PostgreSQL 相容版本之叢集的檔案系統上的資料庫日誌。您可以使用 Amazon CloudWatch Logs 來分析日誌資料。如需詳細資訊,請參閱將 Aurora PostgreSQL 日誌發佈至 Amazon CloudWatch Logs。
使用 AWS 管理主控台也可以監看日誌檔。如需詳細資訊,請參閱 Watching a database log file (監看資料庫日誌檔)。
為了確保在資料庫叢集中盡快進行容錯移轉,請參閱 Amazon Aurora PostgreSQL 的快速容錯移轉。
為了確保寫入器資料庫執行個體在容錯移轉後能夠快速復原,請參閱 Aurora PostgreSQL 的容錯移轉後使用叢集快取管理快速復原。
Amazon Aurora 的高可用性
監控 Amazon Aurora 叢集中的指標
Amazon RDS 事件類別和事件訊息