标记有以下标签的问题: AWS Glue
AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
【以下的问题经过翻译处理】 我正在测试一个lambda函数,它会针对一个存储在S3 上的 Glue表执行批量小型Athena查询。
当我以管理员身份本地执行函数代码时,它会执行查询,它们从不出错,但当Lambda...
【以下的问题经过翻译处理】 如何在使用Glue interactive sessions 运行作业时监控作业指标,如CPU利用率、内存使用情况和网络活动。
【以下的问题经过翻译处理】 我通过阅读这篇博客尝试使用Hudi连接:[使用AWS Glue和Apache Hudi DeltaStreamer直接往Apache...
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】 我正在尝试通过执行CloudFormation模板创建一个Glue作业。以下是IAM策略的详细信息:
* test\_glue\_role : (AmazonS3FullAccess,AWSCloudFormationFullAccess)
* test\_cloudformation\_role :...
【以下的问题经过翻译处理】 我在Glue工作中遇到了错误。
我使用的Glue版本是3.0,支持spark 3.1。
```
ImportError: cannot import name 'ArrayType' from 'pyspark.sql.functions'...
【以下的问题经过翻译处理】 我需要将从Redshift读取的表创建dynamicFrame插入到RDS中,并且该框架包括一个带有韩语字符串值的列。目标数据库的默认编码不是utf-8,因此在编写该框架时需要传递编码选项。我尝试了下面的代码,但是在MySQL中,发现韩语字母仍然无法正确显示。
为什么带有编码参数的jdbc...
【以下的问题经过翻译处理】 大家好,有人知道在Glue Interactive Session Notebook(PySpark)中如何使用matplotlib绘图吗?谢谢。
【以下的问题经过翻译处理】 我在我的redshift集群中有一个表格,我想创建一个脚本,每天每小时运行一次,并扫描此表格以获取基于某些条件的一些数据,然后将其转储到dynamo DB的一个表格中。
我在AWS Glue作业部分中检查了源和目标选项,但当我将Redshift作为源选项时,在目标选项中没有Dynamo DB选项。
有什么方法可以实现这个吗?
【以下的问题经过翻译处理】 我们正在使用一种相当复杂的解决方案将客户自建数据库的数据提取转换加载到我们的API/DB系统中,反之亦然。我想知道是否有类似AWS Glue的工具可以帮助处理这个问题。我们没有直接的DB访问权限,通常选择使用CSV格式的每晚数据文件进行操作。
【以下的问题经过翻译处理】 我使用Glue作业编辑器创建了一个简单的作业,数据源使用了SQL Server 数据库,并通过列进行了过滤(SQL查询),并将其输出到了一个S3存储桶中,以便我可以使用Athena进行查询,一切都可以完美地运行。
现在想要同样的作业用于其他多个表格,所以我编辑了代码,只是复制了以“job =...
【以下的问题经过翻译处理】 如何解决从Amazon Glue到Redshift执行作业的问题?报错信息:"JobName:s3-redshift and JobRunId:jr_30d8ac0c6b35d44f641b7d5b55819365897b18e6244c8a5559bff53efc8e23c1 failed to execute with exception At least one...