Apache Hadoop Yarn-核心的未充分利用

内尔维

无论我修改多少设置,yarn-site.xml即使用以下所有选项

yarn.scheduler.minimum-allocation-vcores
yarn.nodemanager.resource.memory-mb
yarn.nodemanager.resource.cpu-vcores
yarn.scheduler.maximum-allocation-mb
yarn.scheduler.maximum-allocation-vcores

我仍然无法获得我的应用程序,即Spark来利用群集中的所有内核。火花执行器似乎正确地占用了所有可用内存,但是每个执行器仅占用一个核心,没有更多空间。

这是在 spark-defaults.conf

spark.executor.cores                    3
spark.executor.memory                   5100m
spark.yarn.executor.memoryOverhead      800
spark.driver.memory                     2g
spark.yarn.driver.memoryOverhead        400
spark.executor.instances                28
spark.reducer.maxMbInFlight             120
spark.shuffle.file.buffer.kb            200

请注意,spark.executor.cores将其设置为3,但不起作用。我该如何解决?

内尔维

问题不在于有yarn-site.xmlspark-defaults.conf,但实际上与资源计算器,核心分配给执行人或MapReduce作业的情况下,映射器/减速器。

默认资源计算器,即org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator仅使用内存信息来分配容器,默认情况下未启用CPU调度。使用这两种内存以及CPU的计算资源需要改变,以org.apache.hadoop.yarn.util.resource.DominantResourceCalculatorcapacity-scheduler.xml文件。

这就是需要改变的地方。

<property>
    <name>yarn.scheduler.capacity.resource-calculator</name>
    <value>org.apache.hadoop.yarn.util.resource.DominantResourceCalculator</value>
</property>

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Apache Spark 在 Hadoop YARN 上工作的问题

来自分类Dev

充分利用Ubuntu

来自分类Dev

Hadoop 2.0的YARN架构

来自分类Dev

充分利用我的工厂

来自分类Dev

充分利用Julia的整合能力

来自分类Dev

MySQL充分利用了联接

来自分类Dev

如何充分利用XSD

来自分类Dev

如何在Azure HDInsight上将Apache Spark作业提交到Hadoop YARN

来自分类Dev

org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException:auxService:mapreduce_shuffle不存在

来自分类Dev

如何将未充分利用的键盘键更改为修饰键

来自分类Dev

使用Hadoop YARN安装HBase

来自分类Dev

Hadoop YARN简单纱线应用

来自分类Dev

Hadoop:指定distcp的yarn队列

来自分类Dev

无法充分利用cssrewrite产品映像

来自分类Dev

充分利用Perl Data :: Dumper输出

来自分类Dev

充分利用多个线性容器空间的算法

来自分类Dev

RyuJIT没有充分利用SIMD内部函数

来自分类Dev

MySQL没有充分利用服务器

来自分类Dev

如何充分利用葡萄酒?

来自分类Dev

充分利用火力数据的特定类别

来自分类Dev

如何使Row在Flutter中充分利用其子代?

来自分类Dev

充分利用InfoPath 2010中的强大功能

来自分类Dev

如何通过python充分利用多核

来自分类Dev

如何充分利用葡萄酒?

来自分类Dev

gparted是否充分利用了坏块列表?

来自分类Dev

Hadoop Yarn守护程序停止运行

来自分类Dev

hadoop jar和yarn -jar之间的区别

来自分类Dev

namenode没有拿出hadoop YARN

来自分类Dev

在ubuntu上设置Hadoop YARN(单节点)