NGC 提供の Pytorch イメージを使って docker コンテナを立ち上げる。

NVIDIA NGC | CATALOGから NGC(NVIDIA GPU CLOUD)が提供している、Pytorch の docker イメージをとりあえずdocker runをしてみる。

docker run --gpus all -it --rm nvcr.io/nvidia/pytorch:21.12-py3 /bin/bash

すると、下記のような NOTE が一番下に現れたので調べてみた。

NOTE: The SHMEM allocation limit is set to the default of 64MB.
This may be insufficient for PyTorch.  NVIDIA recommends the use
of the following flags: docker run --gpus all --ipc=host --ulimit
memlock=-1 --ulimit stack=67108864 ...

The SHMEM allocation limit is set to the default of 64MB

一時ファイル領域の/dev/shm のサイズでデフォルト値は 64GB。--shm-size 2g みたいにしておけばよい。

–ipc=host

コンテナとホスト間でメモリ共有するためにつけるらしい。自分の場合は普段使わなそう。

–ulimit memlock=-1

占有可能なメモリスペースを無限にする。

–ulimit stack=67108864

スタック領域サイズの上限いっぱいまであげる。

参考


Related Posts