在 Apache Airflow 的数据管道、Step function或 Amazon 托管工作流之间进行选择时,最重要的方面是什么?

0

【以下的问题经过翻译处理】 选择以下一项的要点是什么::

  • 数据管道, *Step function
  • 用于 Apache Airflow 的亚马逊托管工作流
1 回答
0

【以下的回答经过翻译处理】 1. AWS Data Pipeline 是一种网络服务,可帮助您在不同的 AWS 计算和存储服务以及本地数据源之间可靠地处理和移动数据,在指定的时间间隔。借助 AWS Data Pipeline,您可以定期访问存储数据的位置,大规模转换和处理数据,并将结果高效地传输到 AWS 服务,例如 Amazon S3、Amazon RDS、Amazon DynamoDB 和 Amazon EMR。 阅读 ETL。这可以用作 ETL 或数据处理工具。缺点包括

  • 有限的转换和能力
  • 如无新进展AWS Glue 是更好的选择。
  1. 这应该可以解决 ETL 或数据处理的争论。现在谈编排器或调度器,不要与 ETL 或数据处理服务混淆。这些可用于连接或链接多个 ETL 或数据处理服务。 AWS Step Functions 是一种无服务器工作流编排器,非常简单且功能非常有限。 Amazon Managed Workflows for Apache Airflow (MWAA) 是 [Apache Airflow](https://airflow. apache.org/)。这更健壮,更有能力,允许大量集成。根据 AWS 常见问题解答:-

问:我应该何时使用 Amazon MWAA 与 AWS Step Functions?

如果您优先考虑开源和可移植性,则应该使用 Amazon MWAA。 Airflow 拥有一个庞大而活跃的开源社区,定期贡献新功能和集成。 Amazon MWAA 支持现有的 Airflow 工作流和集成,无需更改代码,迁移简单,环境熟悉。

如果您优先考虑成本和性能,则应使用 Step Functions。例如,如果您正在处理流数据并在将其放入 DynamoDB 数据库或 S3 之前通过多个步骤对其进行转换,则您应该使用 Step Functions,因为它以更低的成本提供更高的性能。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则