标记有以下标签的问题: AWS Glue
AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
189 条结果
【以下的问题经过翻译处理】 我尝试使用 Glue ETL 将嵌套的 JSON 数据转换为 Parquet 格式。这个方法是有效的,但由于进行了采样,它无法确定某些字段的数据类型并使用 struct 表示所有可能的值,从而改变了架构。
我尝试使用 ResolveChoice 来强制使用一种类型而不是...
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】 我在s3存储桶中有一个csv文件,并使用一个glue爬虫在Athena上创建一个表。表已创建,但数据出现了问题。部分记录的值被移动到相邻的列中。有没有办法解决这个问题?glue是否适用于csv文件,还是需要将文件转换成parquet或json格式?
【以下的问题经过翻译处理】 客户使用 Talend 进行 ETL,使用 Postgres 进行 DWH。他们希望将 ETL 工作负载迁移到 Glue ETL,将 DWH 放在 Redshift 上。他们想知道如何在AWS Glue中实现以下场景:
1. 在 Glue 作业中从 MS Excel 中提取数据进行进一步处理。
2. 从 SharePoint 中提取数据。目前,他们在...
【以下的问题经过翻译处理】 是否有一种方式可以在MySQL数据库中进行upsert操作?
【以下的问题经过翻译处理】 你好,
我在Terraform的AWS提供程序中没有找到DataBrew。
我发现它在CloudFormation中有支持(<https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-databrew-job.html>)。
有人能帮我找到它吗?
【以下的问题经过翻译处理】 使用Glue Crawlers,我创建了Glue表并从Athena查询——如何将字符串转换为日期格式?“2022-11-16T00: 00: 00.000Z”。
我已尝试过使用to_date函数!
【以下的问题经过翻译处理】 1. 使用Glue从包含以下JSON的S3文件中抓取数据:
```
{"a":"b", "c":"d"}
{"a":"b1", "c":"d2"}
```
2. Crawlers成功地在一个数据库中创建了一个表,并识别了所有列。
3....
【以下的问题经过翻译处理】 客户创建了一个AWS Glue dev终端,并希望在同一个单独的Dev终端上并行运行两个Sagemaker笔记本,但它无法工作。
第一个被调用的仅能运行作业,而另一个失败。可能的原因和解决方法是什么?
【以下的问题经过翻译处理】 您好,
我有一个S3 Bucket,路径如下:“s3://a/b/c”。
在“c”文件夹内,我有每个表的一个文件夹。对于每个这样的表文件夹,我都有每个版本的文件夹。每个版本都是定期进行的数据库快照,由工作流程运行获得。为澄清起见,“c”内部的结构如下:
1. 产品
1. /version\_0
1. \_temporary
...
【以下的问题经过翻译处理】 我试图将数据从 Google BigQuery 迁移到 AWS S3。但是我在来源方面遇到以下问题(控制台)。
连接选项:
为数据源连接输入其他Key-Value对:
\*\*Key: parentProject Value: serene-craft-3363XX
\*\*Key: table Value:...