我想了解導致 Amazon Redshift 替換節點的原因,以及它如何影響叢集。
簡短說明
Amazon Redshift 叢集節點替換是由於硬體故障或硬體效能問題而發生的維護作業。節點替換可能會暫時中斷資料庫連線並影響作業。Amazon Redshift 會替換節點,讓您的資料倉儲叢集保持運作狀態良好、可靠且效能優越。
解決方法
硬體故障
硬體故障、硬體效能問題或潛在的故障風險可能會導致 Amazon Redshift 替換節點。Amazon Redshift 會持續監控每個叢集節點內的硬體元件。當 Amazon Redshift 偵測到某個元件出現問題時,它會替換該節點。
替換節點是一種預防措施,可以避免硬體元件故障而可能導致的資料損壞。但是,當叢集在節點替換後重新分配資料到各節點時,您可能會遇到暫時的效能問題。
排程維護
為了提高叢集的可靠性和效能,Amazon Redshift 會在預設維護時段內執行系統更新、套用修補程式並替換硬體元件。
對叢集作業的影響
當 Amazon Redshift 替換節點時,您可能會遇到暫時性的叢集節點中斷,進而影響效能。如果您收到單節點叢集的硬體故障叢集狀態,那麼您無法替換該節點。而是必須從快照中進行還原。如需詳細資訊,請參閱 Amazon Redshift 快照和備份。
節點替換最佳做法
若要將節點替換對資料庫作業的影響降至最低,請使用下列最佳做法:
- 查看 Amazon Redshift 事件通知,該通知會提醒您維護時段或可能導致節點替換的硬體問題,並相應地規劃您的作業。
- 您可以延遲叢集的維護時段,以便在非尖峰時段或資料庫活動較低的時段進行維護。
- 在您的應用程式中建立重試機制。重試機制可處理節點替換期間的暫時連線遺失或效能低下,以便您的應用程式可以在節點替換完成後復原並運作。所有 AWS SDK 均具有內建的重試機制,其採用指數退避演算法。
- 對生產工作負載使用多節點叢集,因為多節點叢集比單節點叢集具有更佳的容錯能力和可用性。
相關資訊
Amazon Redshift 中的叢集與節點
Amazon Redshift 佈建叢集事件通知
使用 Amazon Redshift 佈建叢集的注意事項