AWS Batch EC2で1GPUのインスタンスに複数のコンテナを起動し複数のコンテナが1GPUを共用したい

0

AWS Batch EC2ではジョブ定義でGPU数を指定することでコンテナにNvidia Runtimeが指定されてインスタンスのGPUが使用できるようです。

しかし、この場合単一のGPUに対して複数のコンテナを起動するのことができません。

ジョブ定義でGPU数を1に設定したジョブが2つ実行された場合、オートスケーリンググループは2つのインスタンスを起動し、それぞれのインスタンスでコンテナを起動します。私は1つのインスタンス上に2つのコンテナを起動し、1つのGPUを2つのコンテナから使いたいです。

どのように設定すれば上記のようなことが可能でしょうか?

preguntada hace 2 meses324 visualizaciones
1 Respuesta
0
Respuesta aceptada

以下のissueはECSのものですが、AWS Batchでも同じような方法で解決できるかもしれません。
「default-runtime」を「nvidia」にすると使えるようになるようです。(ただし、AWS公式の回答ではないので本当に動くのかや最適な方法なのかといった部分は不明です)
https://github.com/aws/containers-roadmap/issues/327#issuecomment-471162879

カスタムAMIの作成はこちらが参考になると思います。
https://dev.classmethod.jp/articles/dlami-for-ecs/

profile picture
EXPERTO
respondido hace 2 meses

No has iniciado sesión. Iniciar sesión para publicar una respuesta.

Una buena respuesta responde claramente a la pregunta, proporciona comentarios constructivos y fomenta el crecimiento profesional en la persona que hace la pregunta.

Pautas para responder preguntas