使用Amazon Redshift的SSIS最佳实践

0

【以下的问题经过翻译处理】 一位客户在其SQL Server环境中使用SSIS执行ETL。他们想要转移到Amazon Redshift,以发挥Redshift给数据仓库带来的所有价值。

将Redshift集成进SSIS工作流程的最佳实践是什么?

profile picture
专家
已提问 5 个月前16 查看次数
1 回答
0

【以下的回答经过翻译处理】 从SQL Server转移到Redshift的客户可能会开始进行Amazon Redshift试点:

  1. 创建他们的第一个Redshift集群(以及AWS VPC子网组、Amazon S3存储桶等辅助AWS组件)。
  2. 加载一些样例数据并熟悉Redshift基础知识(COPY命令,zone mapping等)。
  3. 连接他们最喜欢的BI工具来检查兼容性。

随着他们的进展,他们可以使用AWS DMS从现有的MSSQL数据库中加载数据进行批量复制,以便于对现有数据模型进行实验,查看它在Redshift中的执行情况,了解数据类型的变化,对他们的查询进行变更(特别是像PIVOT这样的操作),等等。

最后,当他们准备开始将数据源直接集成到Redshift时,他们可能会发现他们不需要SSIS,而可以探索Glue等云原生服务或Marketplace提供的Matillion等服务。如果确实需要SSIS,我建议使用一个名为ZappySys的第三方插件。它处理了Redshift加载数据的最佳实践(例如在S3中分段数据,使用S3中的多个文件的COPY命令等)。

希望这有所帮助!

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则