跳至内容

标记有以下标签的问题: 亚马逊云科技 Glue

AWS Glue is a serverless data integration service that makes it easy to discover, prepare, and combine data for analytics, machine learning, and application development.

内容语言: 中文 (简体)

筛选问题
选择要筛选的标签
排序方式
排序方式 最新
按以下条件筛选问题::

浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。

189 条结果
【以下的问题经过翻译处理】 我正在创建一个应用程序/堆栈/解决方案,部署后可以设置必要的基础设施以进行编程查询CloudTrail日志:特别是通过给定的执行角色在某些服务中查找资源创建请求。 从Athena开发人员指南中的这个[查询CloudTrail日志页面](https://docs.aws.amazon.com/athena/latest/ug/cloudtrail-logs.html)等...
1
回答
0
点赞数
81
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 一位客户想知道他们是否可以使用Glue进行维度模型ETL。它是否能够填充维度和事实,并将其加载到Redshift中,或者他们需要在Redshift中创建一个分段表,然后通过使用代理键查询来填充他们的维度和事实? 我没看到为什么Glue不能用于维度建模,但我很难找到相关的资料和信息。
1
回答
0
点赞数
91
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 你好。我们正在进行一种POC,并正在评估Glue的能力。作为评估的一部分,我最近激活了最新版本的"基于Apache Hudi的AWS Glue连接器(版本为0.9.0)"(https://aws.amazon.com/marketplace/pp/prodview-zv3vmwbkuat2e?ref_=beagle&applicationId=GlueStudio)。具...
1
回答
0
点赞数
64
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 EMR Studio中,将EMR Virtual集群附加到Notebook时,无法访问Glue目录。尝试访问Glue时可能会出现一些常见的错误,其中包括: 1. “Hive support is required to ...” 2. “Table or view not found…” 将enableHiveSupport()添加到Spark语句中似乎也不起作用。...
1
回答
0
点赞数
124
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 我从帐户A运行Glue作业,将数据写入帐户B的S3存储桶中。这意味着对象的所有者是帐户A,我无法使用来自帐户B的对象进行操作。 有没有办法告诉Glue作业为存储桶所有者应用具有完全控制权限的ACL?
1
回答
0
点赞数
80
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 我正在尝试使用AWS Glue处理一个文本文件,该文件在第一行中具有标题信息,在最后一行中具有页脚信息。该文件有10个数据列,但页脚只有两个列(文件中的记录数和文件来源)。 在AWS Glue中处理这种类型的文件的最佳方法是什么?
1
回答
0
点赞数
101
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 团队你好, 我想将一个Glue工作流程添加为我的规则的目标。 ``` import * as events from "@aws-cdk/aws-events"; const rule = new events.Rule( this, "object_created_event", { description: ...
1
回答
0
点赞数
71
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 一个客户想在AWS上建立一个数据湖,其中一个数据源将是Oracle Cloud上的统一模型EDW。有哪些选项可以从EDW中提取数据并将其作为文本扁平文件(CSV)加载到S3中? Glue能胜任这项工作吗? 非常感谢。
1
回答
0
点赞数
131
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 我们将开始开发GLUE ETLs。我们看到有不同的开发方式: 1. 通过AWS控制台:这似乎很昂贵、慢,而且不太适合开发脚本。 2. 通过Dev Endpoints:计费费率较高。 3. 通过AWS Glue Docker镜像:功能不完整。 4. 交互式会话。 5. 本地配置。 这些选项中,哪个是配置简单而且不会产生成本的?
1
回答
0
点赞数
66
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 我的客户目前正在使用Glue作业和DynamoDB连接器将DynamoDB数据归档到他们的数据湖中。他们询问是否可以进行增量加载,而不是每天进行全量加载。我看到Glue支持bookmark,这个看起来就像我所需要的,但它只支持S3(和某些JDBC)源。是否有办法实现这个需求?
1
回答
0
点赞数
84
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 我有一个由我的Glue Job生成的pyspark脚本,旨在从S3存储桶中的CSV文件中读取数据并将其写入我的SQL RDS表中。 在我的CSV文件中,我有多行字符串。 如果解析后字符串中引号被正常解析,则作业通过,但在我的情况下,多行字符串中的引号未被正确解析,因此作业无法将数据插入我的表中; 我尝试过: `spark.read.option("multiLine...
1
回答
0
点赞数
189
检视次数
专家

已提问 3 年前

【以下的问题经过翻译处理】 在AWS Glue Catalog数据属性中,sizekey参数是什么含义?
1
回答
0
点赞数
94
检视次数
专家

已提问 3 年前

  • 1
  • •••
  • 7
  • 8
  • 9
  • 10
  • 11
  • •••
  • 16
  • Page size
    12 条/页