标记有以下标签的问题: AWS Glue

AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.

内容语言: 中文 (简体)

Select up to 5 tags to filter
排序方式 最新

浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。

189 条结果
1
回答
0
点赞数
16
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 一位客户想知道他们是否可以使用Glue进行维度模型ETL。它是否能够填充维度和事实,并将其加载到Redshift中,或者他们需要在Redshift中创建一个分段表,然后通过使用代理键查询来填充他们的维度和事实? 我没看到为什么Glue不能用于维度建模,但我很难找到相关的资料和信息。
1
回答
0
点赞数
8
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 你好。我们正在进行一种POC,并正在评估Glue的能力。作为评估的一部分,我最近激活了最新版本的"基于Apache Hudi的AWS...
1
回答
0
点赞数
16
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 EMR Studio中,将EMR Virtual集群附加到Notebook时,无法访问Glue目录。尝试访问Glue时可能会出现一些常见的错误,其中包括: 1. “Hive support is required to ...” 2. “Table or view not...
1
回答
0
点赞数
56
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 我从帐户A运行Glue作业,将数据写入帐户B的S3存储桶中。这意味着对象的所有者是帐户A,我无法使用来自帐户B的对象进行操作。 有没有办法告诉Glue作业为存储桶所有者应用具有完全控制权限的ACL?
1
回答
0
点赞数
28
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 我正在尝试使用AWS Glue处理一个文本文件,该文件在第一行中具有标题信息,在最后一行中具有页脚信息。该文件有10个数据列,但页脚只有两个列(文件中的记录数和文件来源)。 在AWS Glue中处理这种类型的文件的最佳方法是什么?
1
回答
0
点赞数
44
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 团队你好, 我想将一个Glue工作流程添加为我的规则的目标。 ``` import * as events from "@aws-cdk/aws-events"; const rule = new events.Rule( this, "object_created_event", { description: ...
1
回答
0
点赞数
22
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 一个客户想在AWS上建立一个数据湖,其中一个数据源将是Oracle Cloud上的统一模型EDW。有哪些选项可以从EDW中提取数据并将其作为文本扁平文件(CSV)加载到S3中? Glue能胜任这项工作吗? 非常感谢。
1
回答
0
点赞数
43
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 我们将开始开发GLUE ETLs。我们看到有不同的开发方式: 1. 通过AWS控制台:这似乎很昂贵、慢,而且不太适合开发脚本。 2. 通过Dev Endpoints:计费费率较高。 3. 通过AWS Glue Docker镜像:功能不完整。 4. 交互式会话。 5. 本地配置。 这些选项中,哪个是配置简单而且不会产生成本的?
1
回答
0
点赞数
10
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 我的客户目前正在使用Glue作业和DynamoDB连接器将DynamoDB数据归档到他们的数据湖中。他们询问是否可以进行增量加载,而不是每天进行全量加载。我看到Glue支持bookmark,这个看起来就像我所需要的,但它只支持S3(和某些JDBC)源。是否有办法实现这个需求?
1
回答
0
点赞数
18
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 我有一个由我的Glue Job生成的pyspark脚本,旨在从S3存储桶中的CSV文件中读取数据并将其写入我的SQL RDS表中。 在我的CSV文件中,我有多行字符串。 如果解析后字符串中引号被正常解析,则作业通过,但在我的情况下,多行字符串中的引号未被正确解析,因此作业无法将数据插入我的表中; 我尝试过: ...
1
回答
0
点赞数
119
检视次数
profile picture
专家
已提问 10 个月前
【以下的问题经过翻译处理】 在AWS Glue Catalog数据属性中,sizekey参数是什么含义?
1
回答
0
点赞数
44
检视次数
profile picture
专家
已提问 10 个月前