使用 AWS re:Post 即表示您同意 AWS re:Post 使用條款

升級 Amazon EMR 叢集時,我可以採取哪些規劃步驟?

3 分的閱讀內容
0

我需要規劃 Amazon EMR 升級,以跟上快速變化的技術步伐。

簡短描述

為了跟上大數據的快速變化,您必須升級 Amazon EMR 版本。移轉至新版 Amazon EMR 可改善卓越營運和工作負載的有效性。但是,在升級 Amazon EMR 之前,您必須進行規劃和準備。您必須檢閱某些資訊,以及必須遵循程序。

Amazon EMR 版本升級的優點

升級 Amazon EMR 的優點包括:

  • 利用最新功能提高生產力並降低成本。
  • 更新的應用程式執行更快速。
  • 最新的錯誤修正提供穩定的基礎架構。
  • 最新的安全修補程式可強化安全。
  • 開放原始碼軟體功能的最新存取權。

例如,使用 Amazon EMR 6.6 版和更新版本,Log4j 1.x 和 Log4j 2.x 分別會升級為 Log4j 1.2.17 和 Log4j 2.17.1 (或更高版本)。在更高版本中,不需要啟動動作來緩解通用漏洞披露 (CVE)。

解決方案

適用於開放原始碼應用程式的 Amazon EMR 效能最佳化功能

Amazon EMR 為許多開放原始碼應用程式提供效能最佳化功能。

Spark:

Delta Lake:

Flink:

Hadoop:

HBase:

HCatalog:

Hive:

Hudi:

Iceberg:

Presto 和 Trino:

規劃 Amazon EMR 版本升級

請依照下列步驟準備 Amazon EMR 版本升級:

  1. 研究您在目前 Amazon EMR 版本中面臨的問題。
  2. 隔離您要用來測試 EMR 叢集效能的一小部分應用程式或查詢。
  3. 設定 A/B 測試策略,決定最適合您解決方案的 Amazon EMR 版本。在 Amazon EMR 的 A/B 測試中,您可以測試兩個不同版本的服務,以比較它們在環境中的效能。
  4. 逐步將工作負載移轉到新版本的 Amazon EMR。如果您在 Amazon EMR 的生產版本上發現重大問題,可以在此處結束移轉程序。
  5. 移轉完成之後,請終止舊的 Amazon EMR 叢集。

修正與 Amazon EMR 版本升級相關的問題

請依照下列步驟修正升級 Amazon EMR 版本時遇到的問題:

  1. 重新設定應用程式。觀察變更是否會改善應用程式的效能。
  2. 檢查問題是否已由較新版本的應用程式解決。
  3. 變更應用程式或查詢,看看是否可以避免問題。
  4. 檢查開放缺陷和因應措施,以改善應用程式。請聯絡 AWS Premium Support,了解是否有因應措施。
  5. 停止 Amazon EMR 移轉,直到問題解決或有因應措施為止。

Amazon EMR 版本升級的考量

升級 Amazon EMR 版本時,效能迴歸可能會造成問題。升級可能會變更 API,這可能會影響程式碼在較新介面上執行的能力。Amazon EMR 版本升級之後,可能會發生應用程式緩慢和失敗。

當您考慮升級 Amazon EMR 版本時,最佳實務是閱讀版本指南的最新消息?一節。最新消息?一節包括 Amazon EMR 發行版本和日期的相關資訊,以及開放原始碼應用程式常見問題的解決方案。

研究開放原始碼應用程式變更和未解決問題

在決定移轉至新的 Amazon EMR 版本之前,請檢查下列版本備註和開放瑕疵。下列應用程式清單是以 Amazon EMR 6.9 版為基礎。

**注意:**這些超連結會帶您前往第三方應用程式網站、GitHub 或 Apache 網站。


AWS 官方
AWS 官方已更新 2 年前