我想知道如何在 Amazon Aurora PostgreSQL 相容版全球資料庫中執行容錯移轉,以及容錯移轉失敗的原因。
解決方案
對於 Aurora 全球資料庫,有兩種不同的選項可用於執行容錯移轉:
- 手動未計劃容錯移轉 (「卸離並升級」)-使用此選項可從意外中斷中復原或執行災難復原測試。
- 受管規劃容錯移轉-使用此選項進行操作維護或其他規劃的操作程序。
手動未計劃容錯移轉
若要在主要 AWS 區域發生意外中斷後容錯移轉至次要叢集,請先執行下列動作:
- 停止在中斷的情況下向 AWS 區域中的主要 Aurora 資料庫叢集發出 DML 陳述式和其他寫入操作。
- 從次要 AWS 區域識別 Aurora 資料庫叢集,使用該叢集作為新的主要資料庫叢集。如果 Aurora 全球資料庫中有兩個或兩個以上的次要 AWS 區域,請選擇延遲時間最短的次要叢集。
- 從 Aurora 全球資料庫中移除選擇的次要資料庫叢集。
然後,若要完成手動未計劃容錯移轉,請執行下列動作:
- 重新設定應用程式,使其使用新端點將所有寫入作業傳送至現在獨立的 Aurora DB 叢集。如果您在建立 Aurora 全球資料庫時接受提供的名稱,請從叢集的端點字串中移除 -ro 以變更端點。
例如,當次要叢集從 Aurora 全球資料庫中分離時,該次要叢集的端點 my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com 會變成 my-global.cluster-aabb.us-west-1.rds.amazonaws.com。
當您開始向其新增區域時,次要 Aurora 資料庫叢集會成為新 Aurora 全球資料庫的主要叢集。
- 將 AWS 區域新增至資料庫叢集以啟動從主要叢集到次要叢集的複寫程序。
- 視需要新增更多 AWS 區域,以重新建立支援應用程式所需的拓撲。
如需詳細資訊,請參閱從意外中斷中復原 Amazon Aurora 全球資料庫。
受管規劃容錯移轉
若要為 Aurora 全球資料庫啟動受管規劃容錯移轉,請執行下列動作:
- 開啟 Amazon RDS 主控台。
- 選擇 Databases (資料庫),然後尋找您要容錯移轉的 Aurora 全球資料庫。
- 從「動作」功能表中選擇 Fail over global database (容錯移轉全域資料庫)。容錯移轉現在處於擱置中狀態,在您選擇容錯移轉目標之後,程序才會開始。
- 選擇您要升級為主要叢集的次要 Aurora 資料庫叢集。次要資料庫叢集必須可用。
注意:如果您有多個次要資料庫叢集,請比較所有次要資料庫的延遲量。然後,選擇延遲量最小的項目。
- 選擇 Fail over global database (容錯移轉全域資料庫) 以確認您選擇的次要資料庫叢集,然後開始容錯移轉程序。
資料庫清單的狀態欄會顯示容錯移轉程序期間每個 Aurora 資料庫執行個體和 Aurora 資料庫叢集的狀態。
控制台頂端的狀態列會顯示進度,並提供 Cancel failover (取消容錯移轉) 選項。
如果您選擇 Cancel failover (取消容錯移轉),則系統會提供繼續進行容錯移轉或取消容錯移轉程序的選項。
- 選擇 Close (關閉) 以繼續容錯移轉,並關閉提示。
容錯移轉完成後,您可以在 Databases (資料庫) 清單中看到 Aurora DB 叢集及其目前的狀態。如需詳細資訊,請參閱針對 Amazon Aurora 全球資料庫執行受管的計劃容錯移轉。
您也可以透過執行 failover-global-cluster 命令,使用 AWS Command Line Interface (AWS CLI) 啟動受管的計劃容錯移轉。
容錯移轉失敗的原因
容錯移轉可能會因為下列其中一個原因而失敗:
- 來源與目標之間的複寫延遲
- 可用區域失敗
- 計算節點故障
- 資料庫執行個體間的聯網
- 儲存問題
- 大型活動
相關資訊
在 Amazon Aurora 全球資料庫中使用容錯移轉