来自AWS客户的Redshift问题

0

【以下的问题经过翻译处理】 有一个客户正在使用S3、Lambda和Redshift。他们对在数据加载到Redshift(星型/雪花模式)后如何处理数据有一些问题。

客户正在尝试确定一些从数据仓库进行报表的方法。

以下是一些问题:

Redshift中是否有与cubes(立方体)类似的功能?
与我们的方法相比,将数据移入Redshift是否有更好的方法?这是他们提出关于这个问题的全部信息。
Redshift查询的性能,在返回数据时似乎很慢,但在加载数据和返回聚合数据时很快。有没有办法解决我们所见到的性能问题?

谢谢。

profile picture
专家
已提问 5 个月前3 查看次数
1 回答
0

【以下的回答经过翻译处理】 Amazon Redshift本身并不提供立方体/切片/切块功能,这通常由位于数据库之上的软件产品提供。例如,Microstrategy允许您在基于从Redshift表获取的数据集上构建ROLAP立方体。

您能具体说明一下 "我们的方法" 是什么吗?将数据以 "批量" 的方式移入OLAP RDBMS是最佳方式,以最大程度地发挥并行摄取的优势。Redshift提供了COPY命令来执行批量加载摄取。在执行COPY命令之前,数据必须移动到S3存储桶中。ETL工具可能隐藏了这个过程,但在背后这个过程仍会发生。

在Redshift等MPP解决方案中,查询性能主要取决于包含数据的表如何在集群中进行 "分布",以及其中的数据如何进行排序。分布和排序是一种简单的机制,但我们创建了一些 "自动化功能",可以让开发人员不必过于担心这些细节。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则

相关内容