分析
AWS 提供了最广泛的分析服务供您选择,符合您所有数据分析需求,使任何规模的组织以及行业都能利用数据重塑其业务。无论是数据移动、数据存储、数据湖、大数据分析、机器学习,还是介于这些领域之间的其他数据服务,AWS 都能提供具有最佳性价比、可扩展性和低成本的专用服务。
最近的问题
查看全部1/18
- 【以下的问题经过翻译处理】 Kinesis流中写入的数据记录的大小是否有上限?
- 【以下的问题经过翻译处理】 我正试图在 CloudFormation Stack 内创建一个 Glue 表。我收到了以下错误提示: > > Cross account access is not supported for account that hasn't imported Athena catalog to Glue. Please refer to documentation:...
- 【以下的问题经过翻译处理】 通过Google 搜索, 我了解到regexp\_count 函数, 并且看到该函数被 presto 和 athena 支持。但我像这样使用它时: , case when wc.da_waarnemingsequence not like '%Q02%' and (regexp_count(wc.da_waarnemingsequence, 'B01') = 1)...
- 【以下的问题经过翻译处理】 我发现了一个旧的查询,正在尝试理解它。我对FROM部分有一个问题。我知道临时表是一个键值对。但我不明白FROM部分发生了什么。因为它返回了星期的荷兰名称(在键值对中创建),但为什么呢?查询如下: ``` WITH days AS ( SELECT...
- 【以下的问题经过翻译处理】...
- 【以下的问题经过翻译处理】 我正在尝试在SQL中旋转表格,但我不知道如何操作。我有三列:日期、开业时间和关闭时间。有时一天会有两次开业时间。例如: 日期 开业时间 关闭时间 星期一 09.00 12.00 星期一 13.00 17.00 现在我想以列的方式旋转表格,使列名代表日期,行提供有关开业时间的具体信息。例如: 星期一 星期二 星期三 09.00 - 12.00 09.00 - 12.00...
- 【以下的问题经过翻译处理】 我正在编写一个查询,选择不同的条形码。每个条形码都有一个特定的序列。但是在数据库中,条形码存在多次。每次添加序列时,条形码在不同的行中可见。例如: ![Enter image description...
- 【以下的问题经过翻译处理】 您能否建议使用哪些工具来迁移Spark应用程序到AWS?: Spark应用程序仅用于更改数据,没有任何UI。我们会定期启动它,可能每周启动几次。每次启动都会触及不同数量的来自Hadoop的数据。从我们团队中的不同人员启动该应用程序。 * 输入为:Hadoop / Kafka / HDFS中的表, * 输出为:Hadoop /...
- 【以下的问题经过翻译处理】 初次接触Glue和Athena。我跟着AWS社区创建者的一个很好的示例来学习。但是,在我的实际用例中,我想从EventBridge事件的“ detail”部分捕获所有字段,并创建列。这是多层嵌套的。我无法弄清schema 发现过程。我尝试将一个文本文件发布到S3并让Glue Crawler程序工作,但没有成功。
- 【以下的问题经过翻译处理】 我使用AWS Glue Studio创建了一个ETL作业,执行以下过程。 1. 通过Glue数据目录中的表,从Oracle数据库表读取数据源。 2. 执行SQL语句"select * from tableA order by col1"。 3. 将DynamicFrame重新分区到1个输出。 4....
- 【以下的问题经过翻译处理】 我已经使用了通过`getResolvedOptions`函数检索的临时路径,作为`relationlize`函数的“staging_path”。 发现作业有时会失败 - 这意味着**不规则** -...
- 【以下的问题经过翻译处理】 你好, 当创建 Glue DevEndpoint 时,它会作为 AWS 托管实例运行。有没有办法创建一个运行在客户端管理实例的 DevEndpoint?
- 【以下的问题经过翻译处理】 在AWS控制台中,我只能将Worker类型从G.1X切换到G.2X,无法切换到Standard或G.025X,这是为什么?
- 【以下的问题经过翻译处理】 在Glue作业中,勾选复选框可以启用Spark UI,并指定一个S3路径作为日志存储的位置。那该如何访问Spark UI的URL?
- 【以下的问题经过翻译处理】 我正在用 Java 编写 Spark 作业以在 AWS Glue 上执行。它尝试使用 glueContext.getSource() 方法连接到 Postgres 数据库。它因以下 NullPointerException 而失败: ``` 2023-04-20 14:57:01,183 错误 [main] glue.ProcessLauncher...
- 【以下的问题经过翻译处理】 我有一个需求,需要创建ETL从100个数据文件(每个文件都有独特的模式)转换成一个公共格式的CSV文件。源文件在S3存储桶文件夹中(每个文件夹都是唯一的数据集)。有时需要在一个文件夹中联合多个文件,并在转换中编写业务逻辑。这些文件有数百万条记录。 我已经尝试使用Glue Cralwer和Glue jobs使用有限数据创建目标文件。...
- 【以下的问题经过翻译处理】 尝试从单一的源加载表.. 源表包含 EMP NAME, ADDRESS 的数据... 目标表 A 包含 EMP ID(自动生成的主键)和 EMP NAME... 表 B 包含 EMP ID(外键)、ADDRESS ID(自动生成的主键)和 ADDRESS... 现在如何使用 AWS Glue 加载这些表? 没有找到合适的相关说明... 有人能帮忙解答一下吗?
- 【以下的问题经过翻译处理】 无法从AWS Glue建立到Amazon Redshift的连接。以前使用相同的设置却可以。 1. 检查过 Redshift中的公共访问设置 2. 为S3创建VPC终端节点 3. 配置正确规则的安全组 4. 验证凭据 5. 验证附加到AWS Glue的IAM角色,甚至提供管理员特权
知识中心最近内容
查看全部1/18
- AWS 官方已更新 8 个月前
1/18