无法使用基于先前运行集群实例创建的AMI还原ParallelCluster集群

0

【以下的问题经过翻译处理】 我正在建立一个类似于https://aws.amazon.com/blogs/compute/running-ansys-fluent-on-amazon-ec2-c5n-with-elastic-fabric-adapter-efa/描述的群集。

在第一次尝试中,我安装了libreoffice并添加了一些变化来创建一个AMI环境。我在配置文件的群集部分添加了一个custom_ami标签,成功恢复了环境。得到的环境具有预期的差异。

在第二次尝试中,我进行了大量设置的修改,包括:

  • 添加了一个ebs部分,并指定了加密
  • 安装某些第三方软件包,包括conda和MATLAB
  • 指定一个cronjob在重新启动时初始化nicedcv会话

当我创建这个环境的AMI并告诉pcluster使用它时,生成的实例未通过状态检查,无法访问。

有没有不兼容AMI恢复的某些功能?是否需要额外的步骤来创建与pcluster兼容的AMI?

profile picture
EXPERTE
gefragt vor 7 Monaten10 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 你好,David,

我知道你想通过使用另一个正在运行的集群的主节点的AMI作为custom_ami来创建一个新的集群,但如果我有什么误解,请纠正我。

如果是这样,我必须确认它是行不通的。你不能将一个正在运行的实例的AMI作为新集群的基础AMI重复使用。

原因是,在实例引导期间,ParallelCluster执行配置动作,这取决于它是集群的主节点还是计算节点。

通过使用主节点AMI,你正在尝试在已经执行了配置步骤的新集群上创建一个新集群,因此这个AMI不能正常工作,也不能用作计算节点。

如果你使用“修改AWS ParallelCluster AMI”的方法,你应该始终从这个列表中的AMI开始:https://github.com/aws/aws-parallelcluster/blob/v2.10.0/amis.txt

在此处查看更多详细信息:https://docs.aws.amazon.com/parallelcluster/latest/ug/tutorials_02_ami_customization.html#modify-an-aws-parallelcluster-ami

如果有所帮助,请让我们知道。

profile picture
EXPERTE
beantwortet vor 7 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen