标记有以下标签的问题: Amazon EMR
Amazon EMR is a cloud big data platform for running large-scale distributed data processing jobs, interactive SQL queries, and machine learning (ML) applications using open-source analytics frameworks such as Apache Spark, Apache Hive, and Presto.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
51 条结果
【以下的问题经过翻译处理】 Hi,我想在 EMR Serverless上运行一个Job,该Job从 PostgreSQL 中读取和写入数据。我已经下载了 Jar 文件并将其上传到 S3,并在管理控制台的 Spark 属性中设置了 "spark.jars"。然而,作业失败了。
谢谢,Muthu
【以下的问题经过翻译处理】 我们可以使用用户管理的KMS密钥与EMR笔记本一起加密本地文件系统吗?
【以下的问题经过翻译处理】...
【以下的问题经过翻译处理】 针对这两个选项,在创建数据湖时有什么区别?
【以下的问题经过翻译处理】 Amazon EMR是否支持Apache Flink 1.9.0?
【以下的问题经过翻译处理】 大家好,有人知道授予Amazon EMR集群成员访问Amazon DynamoDB以实现EMRFS一致视图的最小IAM策略声明是什么吗?
`AmazonElasticMapReduceforEC2Role` 在`*`资源上授予了`dynamodb:*`,这非常广泛。
理想的答案应同时具有所需的有限动作集和更窄的资源规范。
谢谢!
【以下的问题经过翻译处理】 是否包括在将来节点中换新的自定义AMI的能力。文档的阅读似乎表明没有,但需要确认。
【以下的问题经过翻译处理】 我们可以使用 Step Function 来编排Sqoop作业吗?目标是创建一个暂时的集群,先使用Sqoop加载数据,然后在Hive中进行转换,但看起来[Command...
【以下的问题经过翻译处理】 我无法在EMR Jupyter笔记本中安装和启用Voila和Jupyter仪表板扩展。您能否请提供指导?
【以下的问题经过翻译处理】 我发现YARN timeline server server 的.out文件异常大,它占用了/mnt分区。
这个文件只是 jersey-server model 里的AbstractWadlGeneratorGrammarGenerator类写了大量无用消息。
但是,AbstractWadlGeneratorGrammarGenerator使用 Java...
【以下的问题经过翻译处理】 我正在尝试使用PySpark和本地Python在AWS EMR中从3个节点的MongoDB集群(副本集)中读取数据。当在AWS EMR群集中执行代码时,我遇到了问题,如下所述,但相同的代码在我的本地Windows机器上运行良好。
* Spark版本- 2.4.8
* Scala版本- 2.11.12
* MongoDB版本- 4.4.8
*...
【以下的问题经过翻译处理】 在AWS EMR控制台上,我们看到AWS EMR 6.5.0版本已经可用。
然而,EMR文档没有关于6.5.0的具体信息。
基于EMR的发布,文档将何时更新?