1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 AWS Glue的主要重点是解决你描述的问题,还有处理更大的数据集。
显然,如果你没有之前使用Apache Spark(Glue ETL基于它)的经验,根据你的连接和转换逻辑的复杂程度,你可能会遇到挑战。因此,值得投入一些时间来了解其工作原理以及如何监控。
成本效益取决于你的逻辑有多么高效以及你如何调整配置。Glue 4.0提供了许多改进和开箱即用的优化,应该能帮助你解决这个问题。
Glue Crawlers是可选的方便功能,如果你只需要读取一次csv文件(如果不是需要为其他目的使用的表),你可以直接读取它们。
Step Function 需要一些学习,但可以构建高级工作流,对于简单的工作流,Glue提供了触发器和Glue内部的可视化工作流。s
相关内容
- AWS 官方已更新 3 年前
- AWS 官方已更新 3 年前
- AWS 官方已更新 3 个月前