AWS Batch EC2で1GPUのインスタンスに複数のコンテナを起動し複数のコンテナが1GPUを共用したい

0

AWS Batch EC2ではジョブ定義でGPU数を指定することでコンテナにNvidia Runtimeが指定されてインスタンスのGPUが使用できるようです。

しかし、この場合単一のGPUに対して複数のコンテナを起動するのことができません。

ジョブ定義でGPU数を1に設定したジョブが2つ実行された場合、オートスケーリンググループは2つのインスタンスを起動し、それぞれのインスタンスでコンテナを起動します。私は1つのインスタンス上に2つのコンテナを起動し、1つのGPUを2つのコンテナから使いたいです。

どのように設定すれば上記のようなことが可能でしょうか?

gefragt vor 3 Monaten325 Aufrufe
1 Antwort
0
Akzeptierte Antwort

以下のissueはECSのものですが、AWS Batchでも同じような方法で解決できるかもしれません。
「default-runtime」を「nvidia」にすると使えるようになるようです。(ただし、AWS公式の回答ではないので本当に動くのかや最適な方法なのかといった部分は不明です)
https://github.com/aws/containers-roadmap/issues/327#issuecomment-471162879

カスタムAMIの作成はこちらが参考になると思います。
https://dev.classmethod.jp/articles/dlami-for-ecs/

profile picture
EXPERTE
beantwortet vor 3 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen