Nvidia相关工具包安装
1 前言
首先理清一下关系,有关于 Nvidia 的有:
CUDA
:为 "GPU 通用计算 " 构建的运算平台。Nvidia GPU Driver
:即显卡驱动CUDA toolkit (nvidia)
: CUDA 完整的工具安装包,其中提供了 Nvidia 驱动程序、开发 CUDA 程序相关的开发工具包等可供安装的选项。包括 CUDA 程序的编译器、IDE、调试器等,CUDA 程序所对应的各式库文件以及它们的头文件。CUDA Toolkit (Pytorch)
: CUDA 不完整的工具安装包,其主要包含在使用 CUDA 相关的功能时所依赖的动态链接库。不会安装驱动程序。cuDNN
:为深度学习计算设计的软件库。
一般来说,许多包必须依赖于具体的 CUDA 版本,现在最常用的是 CUDA11.x 和 CUDA12.x 。
另外,如果走安装 CUDA toolkit 和 open GPU Driver 这个路子,就不需要下载 Nvidia 官方闭源驱动,并且需要在安装之前完全卸载所有 Nvidia 相关的驱动。
简而概之
如果不需要 CUDA Toolkit,先装最新的显卡驱动,自带 CUDA,依照 CUDA 版本,安装对应的 torch 版本。
如果需要 CUDA Toolkit,则可以直接按照官网步骤正确安装 CUDA Toolkit,安装完成后自带显卡驱动、CUDA,之后再对应安装 torch 即可。
2 安装步骤
2.1 卸载所有 Nvidia 驱动
2.2 安装 CUDA Toolkit
CUDA Toolkit 12.6 安装方法参见 CUDA Toolkit 12.6
CUDA Toolkit 11.8 安装方法参见 CUDA Toolkit 11.8
2.3 安装显卡驱动
2.4 安装 cuDNN
前提是按照上述步骤安装好了 cuda repo,才能直接使用 apt 安装 cudnn。
3 Bugfix
3.1 FAIL : Failed to Load Library libonnxruntime_providers_cuda.so with Error: libcudnn.so.8: Cannot Open Shared Object File: No such File or Directory
这是因为 CUDA12.5 缺少了 libcudnn.so.8 这个库,可通过单独安装。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 天澄拾光!
评论
ArtalkGitalk