DockerでCUDAを扱う際に生じたトラブル:Error response from daemon: OCI runtime create failed: unable to retrieve OCI runtime error
確認するべきは
*CUDAのバージョン* >= イメージ"nvidia/cudaのバージョン"
であるかどうか.これなら問題は無いはず.
以下,余談
ubuntu18.04をnvidia-driver:450. CUDA version: 11.0で動かしていたが, 20/10/16時点におけるnvidia/cudaの最新バージョンはCUDA version: 11.1に対応したものだった.
docker run --gpus all nvidia/cuda:latest
とすると,
まさにこのエラーが発生する.
イメージのバージョンが高すぎたためにエラーが発生した.
またイメージがCUDA version:9.0をpullした場合は無事に動く.
REPOSITORY TAG IMAGE ID CREATED SIZE nvidia/cuda 11.0-devel-ubuntu18.04 d89f75c1799d 5 days ago 3.74GB nvidia/cuda 9.0-base bd52bf936aec 2 weeks ago 144MB ubuntu latest 9140108b62dc 2 weeks ago 72.9MB kilin@kilin-ubu18:~/Documents/env0/docker_config$ docker run -it --gpus all nvidia/cuda:9.0-base root@d4ca4a757de2:/# nvidia- bash: nvidia-: command not found root@d4ca4a757de2:/# nvidia-smi Thu Oct 15 15:55:15 2020 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 450.51.05 Driver Version: 450.51.05 CUDA Version: 11.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 GeForce GTX 166... On | 00000000:09:00.0 Off | N/A | | 31% 35C P8 12W / 125W | 193MiB / 5941MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| +-----------------------------------------------------------------------------+ root@d4ca4a757de2:/#