当原始EBS快照丢失时如何更新Parallelcluster集群配置

0

【以下的问题经过翻译处理】 你好,

我使用ParallelCluster 2.10配置了一个集群,已经运行了半年多了。它有两个挂载了EBS资源的点:/shared和/install。似乎这两个挂载点关联的EBS快照都已经被删除。这应该不是问题,因为这些快照仅用于初始化集群。然而,现在我试图更新集群的配置——只是添加了一个计算节点(增加了max_queue_size),但是我遇到了以下错误信息:

<code>

(venv_aws) > pcluster update flacscloudHPC-2-10-0 -c ./config_flacscloudHPC

从CloudFormation中检索集群flacscloudHPC-2-10-0的配置...

验证配置文件./config_flacscloudHPC...

警告:配置参数“scheduler”生成了以下警告:

您正在使用的作业调度程序(torque)将在ParallelCluster的未来版本中被停用。更多信息请参见:https://github.com/aws/aws-parallelcluster/wiki/Deprecation-of-SGE-and-Torque-in-ParallelCluster

错误:部分 [ebs custom2] 的配置错误

快照snap-0870f8601759ca239似乎不存在:快照“snap-0870f8601759ca239”不存在。

</code>

在没有原始快照“snap-0870f8601759ca239”的情况下,我应该如何更新max_queue_size?强制使用一些已更新的现有快照重新配置集群是否安全?

profile picture
EXPERTE
gefragt vor 6 Monaten13 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 你好,mfolusiak1,

为了执行更新,请确保集群配置中满足以下条件:

  1. 将“ebs_snapshot_id”设置为已删除快照的值
  2. 确保“volume_size”也已设置。如果没有,请添加并确保它反映了现有容量的大小
  3. 禁用健康检查,将“sanity_check”设置为“false”

完成上述步骤后,你可以使用“pcluster update”命令执行更新。

编辑者:luca-aws,于2021年9月7日上午5:40修改。

profile picture
EXPERTE
beantwortet vor 6 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen