1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 1. AWS Data Pipeline 是一种网络服务,可帮助您在不同的 AWS 计算和存储服务以及本地数据源之间可靠地处理和移动数据,在指定的时间间隔。借助 AWS Data Pipeline,您可以定期访问存储数据的位置,大规模转换和处理数据,并将结果高效地传输到 AWS 服务,例如 Amazon S3、Amazon RDS、Amazon DynamoDB 和 Amazon EMR。 阅读 ETL。这可以用作 ETL 或数据处理工具。缺点包括
- 有限的转换和能力
- 如无新进展AWS Glue 是更好的选择。
- 这应该可以解决 ETL 或数据处理的争论。现在谈编排器或调度器,不要与 ETL 或数据处理服务混淆。这些可用于连接或链接多个 ETL 或数据处理服务。 AWS Step Functions 是一种无服务器工作流编排器,非常简单且功能非常有限。 Amazon Managed Workflows for Apache Airflow (MWAA) 是 [Apache Airflow](https://airflow. apache.org/)。这更健壮,更有能力,允许大量集成。根据 AWS 常见问题解答:-
问:我应该何时使用 Amazon MWAA 与 AWS Step Functions?
如果您优先考虑开源和可移植性,则应该使用 Amazon MWAA。 Airflow 拥有一个庞大而活跃的开源社区,定期贡献新功能和集成。 Amazon MWAA 支持现有的 Airflow 工作流和集成,无需更改代码,迁移简单,环境熟悉。
如果您优先考虑成本和性能,则应使用 Step Functions。例如,如果您正在处理流数据并在将其放入 DynamoDB 数据库或 S3 之前通过多个步骤对其进行转换,则您应该使用 Step Functions,因为它以更低的成本提供更高的性能。
相关内容
- AWS 官方已更新 3 年前
- AWS 官方已更新 1 年前
- AWS 官方已更新 3 年前
- AWS 官方已更新 6 个月前