标记有以下标签的问题: AWS Glue
AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
189 条结果
【以下的问题经过翻译处理】 我加载了json数据,并在动态数据帧上使用了relationalize方法,以扁平化原本嵌套的json对象,并将其保存为parquet格式。问题是,一旦保存为parquet格式,用于更快的Athena查询的列名包含点,这违反了Athena...
【以下的问题经过翻译处理】 我有一个使用大写字符的表名和列名的RDS PostgreSQL数据库。我创建了一个Glue爬虫,通过JDBC连接到数据库,并在转化为数据目录时将大写字符转换为小写字符。当我运行Glue作业进行查询时,出现以下错误:
An error occurred while calling o94.getDynamicFrame. ERROR: column "id" does...
【以下的问题经过翻译处理】 我从S3存储桶中读取文件,将其转换为Spark DataFrame,进行转换后又将其转换回Dyanmic DataFrame,然后写入Data...
【以下的问题经过翻译处理】 你好!我是一名经常使用SageMaker Notebooks工作的数据科学家。我想了解何时应该使用Glue Interactive而不是SageMaker Processing。据我了解,它们非常相似,我很难区分它们。谢谢!
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】 我已经尝试了一个星期,但是我开始放弃了——我需要一些帮助理解这个。我有一个S3存储桶,里面装满了XML文件,我正在创建一个pyspark...
【以下的问题经过翻译处理】 你好,
有人可以帮忙吗?
我设置了一个跟踪来审计帐户中的所有 TLS 调用并将所有日志保存在 S3 中。我尝试使用 Athena 从 S3 查询日志。这是我创建的查询:
```
创建外部表 cloudtrail_logs_tls_calls (
事件版本 STRING,
用户身份结构<
类型:字符串,
主体...
【以下的问题经过翻译处理】 我在AWS Glue中有许多数据集,其中包含数百个列,但我只需要其中的几个列进行特征选择。我在AWS Glue DataBrew中并未找到保留所需列并删除其余列的选项。请问是否有办法实现这个功能
【以下的问题经过翻译处理】 我有一个文件,目前存储在S3桶中,包含约1000行,我想将这个文件分成更小的文件(每个文件约有200-500行)。
我在互联网上搜寻过,只发现将文件合并成较大的文件的解决方案。我可以使用Glue自定义输出文件吗?还是应该使用其他方法?
【以下的问题经过翻译处理】 您好,
我正在尝试使用Boto3构建Glue部署系统。我已经成功将Glue脚本Python文件上传到Glue Sources S3桶中,并创建了一个任务。这里没有问题。
下一步是,当我想要更新脚本文件时,不修改任何其他任务参数。我尝试重新上传更新后的脚本文件(与之前的文件同名),并假设在从Glue...
【以下的问题经过翻译处理】 我有这样的需求:假设我有10个不同的Glue PySpark作业(job1、job2、.......job10),当job1执行并成功后,它就会启动下一个Glue Python shell脚本(假设脚本的名称是:glue_common_python_shell.py)。
每次Glue Python shell都会有不同的参数。
换句话说,当Glue...
【以下的问题经过翻译处理】 我正在运行一个AWS Glue DataBrew的测试任务,对一个包含每天按产品计算的总成本的CSV数据集进行简单的**Group...