1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 如果没有为此设计的数据建模(即允许跨整个数据集进行基于时间的查询的分片 GSI),则不可能从 DynamoDB 表执行增量“书签”加载,然后需要自定义读取器(Glue不支持 GSI 查询)。
使用 streams --> lambda --> firehose 是目前将增量更改从 DynamoDB 表交付到 S3 的最“托管”且最具成本效益的方式。
读取 DynamoDB 流仅具有与之关联的 Lambda 的计算成本,并且 Lambda 可以从一次调用中读取数百个项目。让 Firehose 将这些更改缓冲/打包/存储为 S3 上的压缩/分区/可查询数据既简单又经济。
如果您担心成本,可能值得打开一个 specreq 让专家看一下分析——这些配置既常见又通常具有成本效益(成本与表的大小无关,而是速度/写入的大小 - 这通常比自定义读取器/加载器更有效)。
相关内容
- AWS 官方已更新 1 年前
- AWS 官方已更新 10 个月前