在 Apache Airflow 的数据管道、Step function或 Amazon 托管工作流之间进行选择时,最重要的方面是什么?

0

【以下的问题经过翻译处理】 选择以下一项的要点是什么::

  • 数据管道, *Step function
  • 用于 Apache Airflow 的亚马逊托管工作流
1 回答
0

【以下的回答经过翻译处理】 1. AWS Data Pipeline 是一种网络服务,可帮助您在不同的 AWS 计算和存储服务以及本地数据源之间可靠地处理和移动数据,在指定的时间间隔。借助 AWS Data Pipeline,您可以定期访问存储数据的位置,大规模转换和处理数据,并将结果高效地传输到 AWS 服务,例如 Amazon S3、Amazon RDS、Amazon DynamoDB 和 Amazon EMR。 阅读 ETL。这可以用作 ETL 或数据处理工具。缺点包括

  • 有限的转换和能力
  • 如无新进展AWS Glue 是更好的选择。
  1. 这应该可以解决 ETL 或数据处理的争论。现在谈编排器或调度器,不要与 ETL 或数据处理服务混淆。这些可用于连接或链接多个 ETL 或数据处理服务。 AWS Step Functions 是一种无服务器工作流编排器,非常简单且功能非常有限。 Amazon Managed Workflows for Apache Airflow (MWAA) 是 [Apache Airflow](https://airflow. apache.org/)。这更健壮,更有能力,允许大量集成。根据 AWS 常见问题解答:-

问:我应该何时使用 Amazon MWAA 与 AWS Step Functions?

如果您优先考虑开源和可移植性,则应该使用 Amazon MWAA。 Airflow 拥有一个庞大而活跃的开源社区,定期贡献新功能和集成。 Amazon MWAA 支持现有的 Airflow 工作流和集成,无需更改代码,迁移简单,环境熟悉。

如果您优先考虑成本和性能,则应使用 Step Functions。例如,如果您正在处理流数据并在将其放入 DynamoDB 数据库或 S3 之前通过多个步骤对其进行转换,则您应该使用 Step Functions,因为它以更低的成本提供更高的性能。

profile picture
专家
已回答 10 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则