1回答
- 新しい順
- 投票が多い順
- コメントが多い順
0
【以下的回答经过翻译处理】 AWS Lake Formation蓝图与您的数据库建立JDBC连接,并有效地对您要导入的表执行“select *”。它被称为数据库快照,因为它在某个时间点带来了完整的表。它不使用RDS备份快照来导入数据。
Lake Formation使您能够从蓝图创建工作流,在Lake Formation中创建工作流更加简单和自动化。另一种选择是在 AWS Glue中创建工作流。 Lake Formation提供以下类型的蓝图:
数据库快照 – 从JDBC源将所有表中的数据加载或重新加载到数据湖中。您可以根据排除模式从源中排除一些数据。
增量数据库——基于先前设置的书签,仅将新数据从 JDBC 源加载到数据湖中。您指定要包括的 JDBC 源数据库中的各个表。对于每个表,您选择书签列和书签排序顺序以跟踪以前加载的数据。第一次针对一组表运行增量数据库蓝图时,工作流会加载表中的所有数据并为下一次增量数据库蓝图运行设置书签。因此,您可以使用增量数据库蓝图而不是数据库快照蓝图来加载所有数据,前提是您将数据源中的每个表指定为参数。
日志文件 – 从日志文件源批量加载数据,包括AWS CloudTrail、Elastic Load Balancing日志和Application Load Balancer日志。
不要将这与Amazon RDS中可以从RDS备份快照中获取数据并将其加载到S3中的功能混淆。有关这方面的更多信息,请参阅:https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_ExportSnapshot.html
関連するコンテンツ
- AWS公式更新しました 1年前