标记有以下标签的问题: AWS Glue
AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
189 条结果
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】 一位客户想知道他们是否可以使用Glue进行维度模型ETL。它是否能够填充维度和事实,并将其加载到Redshift中,或者他们需要在Redshift中创建一个分段表,然后通过使用代理键查询来填充他们的维度和事实?
我没看到为什么Glue不能用于维度建模,但我很难找到相关的资料和信息。
【以下的问题经过翻译处理】 你好。我们正在进行一种POC,并正在评估Glue的能力。作为评估的一部分,我最近激活了最新版本的"基于Apache Hudi的AWS...
【以下的问题经过翻译处理】 EMR Studio中,将EMR Virtual集群附加到Notebook时,无法访问Glue目录。尝试访问Glue时可能会出现一些常见的错误,其中包括:
1. “Hive support is required to ...”
2. “Table or view not...
【以下的问题经过翻译处理】 我从帐户A运行Glue作业,将数据写入帐户B的S3存储桶中。这意味着对象的所有者是帐户A,我无法使用来自帐户B的对象进行操作。
有没有办法告诉Glue作业为存储桶所有者应用具有完全控制权限的ACL?
【以下的问题经过翻译处理】 我正在尝试使用AWS Glue处理一个文本文件,该文件在第一行中具有标题信息,在最后一行中具有页脚信息。该文件有10个数据列,但页脚只有两个列(文件中的记录数和文件来源)。
在AWS Glue中处理这种类型的文件的最佳方法是什么?
【以下的问题经过翻译处理】 团队你好,
我想将一个Glue工作流程添加为我的规则的目标。
```
import * as events from "@aws-cdk/aws-events";
const rule = new events.Rule(
this,
"object_created_event",
{
description:
...
【以下的问题经过翻译处理】 一个客户想在AWS上建立一个数据湖,其中一个数据源将是Oracle Cloud上的统一模型EDW。有哪些选项可以从EDW中提取数据并将其作为文本扁平文件(CSV)加载到S3中? Glue能胜任这项工作吗?
非常感谢。
【以下的问题经过翻译处理】 我们将开始开发GLUE ETLs。我们看到有不同的开发方式:
1. 通过AWS控制台:这似乎很昂贵、慢,而且不太适合开发脚本。
2. 通过Dev Endpoints:计费费率较高。
3. 通过AWS Glue Docker镜像:功能不完整。
4. 交互式会话。
5. 本地配置。
这些选项中,哪个是配置简单而且不会产生成本的?
【以下的问题经过翻译处理】 我的客户目前正在使用Glue作业和DynamoDB连接器将DynamoDB数据归档到他们的数据湖中。他们询问是否可以进行增量加载,而不是每天进行全量加载。我看到Glue支持bookmark,这个看起来就像我所需要的,但它只支持S3(和某些JDBC)源。是否有办法实现这个需求?
【以下的问题经过翻译处理】 我有一个由我的Glue Job生成的pyspark脚本,旨在从S3存储桶中的CSV文件中读取数据并将其写入我的SQL RDS表中。
在我的CSV文件中,我有多行字符串。
如果解析后字符串中引号被正常解析,则作业通过,但在我的情况下,多行字符串中的引号未被正确解析,因此作业无法将数据插入我的表中;
我尝试过:
...
【以下的问题经过翻译处理】 在AWS Glue Catalog数据属性中,sizekey参数是什么含义?