1 Answer
- Newest
- Most votes
- Most comments
0
【以下的回答经过翻译处理】 Glue可以用于将维度数据加载到Redshift中。其处理方法取决于维度类型(SCD Type)。并且你可以在Glue中生成代理ID。例如:我以前使用过这个功能。
def customer_id(custid):
x = int(str(hashlib.md5(custid.encode()).hexdigest()[:10]),16)
x = int(x)
return x
然而,确保你在不同的数据集上始终按照此逻辑生成代理ID以保持一致性。
理想情况下,应该存在一个staging表,以将数据从staging表传输到主表。你可以通过Redshift的存储过程或纯SQL来编写业务逻辑,具体用哪种方式取决于业务的复杂程度。
Relevant content
- asked a year ago
- Accepted Answerasked 10 months ago
- Accepted Answerasked 3 months ago
- AWS OFFICIALUpdated 2 years ago
- AWS OFFICIALUpdated a year ago
- AWS OFFICIALUpdated 2 years ago