问题
nvidia-smi
输出正常,nvcc --version
输出正常,但 pytorch 调用显卡一直报错 cuda runtime error (802) : system not yet initialized
。
解决方法
执行 sudo systemctl status nvidia-fabricmanager
发现服务启动失败,日志显示原因是 nvidia-fabricmanager 版本跟驱动版本不一致。
在官网下载与驱动版本一致的 nvidia-fabricmanager 并安装即可。
Comments NOTHING