别再折腾了!Ubuntu 20.04下NVIDIA驱动、CUDA 12.6、cuDNN一条龙安装避坑指南

张开发
2026/4/21 5:18:13 15 分钟阅读

分享文章

别再折腾了!Ubuntu 20.04下NVIDIA驱动、CUDA 12.6、cuDNN一条龙安装避坑指南
Ubuntu 20.04深度学习环境配置终极指南从驱动到cuDNN的完美避坑方案每次看到终端里密密麻麻的命令行是不是感觉头都大了特别是当你在Ubuntu 20.04上配置NVIDIA驱动、CUDA和cuDNN时一个不小心就会陷入版本冲突的泥潭。别担心这篇文章将带你一步步避开所有坑用最简单的方式完成环境配置。1. 环境准备打好基础才能走得更远在开始安装之前我们需要确保系统处于最佳状态。打开终端CtrlAltT让我们先来几个基础操作sudo apt update sudo apt upgrade -y这个命令会更新系统的软件包列表并升级所有已安装的包。小提示如果这是你第一次使用sudo命令系统会要求你输入密码。输入时不会显示任何字符这是正常的安全措施。接下来确认你的NVIDIA显卡型号lspci | grep -i nvidia你会看到类似这样的输出01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2070] (rev a1)重要检查项确保你的显卡支持CUDA大多数现代NVIDIA显卡都支持记录下你的显卡型号后续可能需要参考2. NVIDIA驱动安装选择最适合你的方式驱动安装是整个过程中最容易出问题的环节。我们先来看两种主流安装方法的对比安装方法优点缺点推荐人群系统仓库安装简单快捷自动处理依赖版本可能不是最新新手用户官方.run文件可以安装特定版本需要手动处理更多配置高级用户对于大多数用户我强烈推荐使用系统仓库安装。执行以下命令查看推荐驱动ubuntu-drivers devices输出示例 /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 modalias : pci:v000010DEd00001F15sv00001458sd0000405Bbc03sc00i00 vendor : NVIDIA Corporation model : TU106 [GeForce RTX 2070] driver : nvidia-driver-470-server - distro non-free driver : nvidia-driver-470 - distro non-free recommended driver : nvidia-driver-510 - distro non-free driver : xserver-xorg-video-nouveau - distro free builtin看到recommended标记的版本了吗那就是系统推荐安装的驱动版本。直接安装它sudo apt install nvidia-driver-470安装完成后必须重启系统sudo reboot重启后验证驱动是否安装成功nvidia-smi如果看到类似下面的输出恭喜你驱动安装成功了----------------------------------------------------------------------------- | NVIDIA-SMI 470.161.03 Driver Version: 470.161.03 CUDA Version: 11.4 | |--------------------------------------------------------------------------- | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | || | 0 NVIDIA GeForce ... Off | 00000000:01:00.0 On | N/A | | 0% 48C P8 10W / 180W | 387MiB / 7982MiB | 0% Default | | | | N/A | ---------------------------------------------------------------------------特别注意nvidia-smi输出的顶部会显示你的驱动支持的CUDA版本如上例中的11.4。这个数字非常重要它决定了你能安装的最高CUDA版本。3. CUDA Toolkit安装版本兼容是关键现在来到重头戏——CUDA安装。根据上一步nvidia-smi显示的CUDA版本我们需要选择兼容的CUDA Toolkit版本。以当前最新的CUDA 12.6为例首先下载安装包wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run然后运行安装程序sudo sh cuda_12.6.2_560.35.03_linux.run安装过程中有几个关键点需要注意输入accept同意许可协议最重要的一步由于我们已经安装了驱动在这里必须取消勾选Driver安装按空格键取消选中其他选项保持默认即可安装完成后我们需要配置环境变量。编辑你的bash配置文件nano ~/.bashrc在文件末尾添加以下内容如果安装的是其他CUDA版本请相应修改路径中的版本号export PATH/usr/local/cuda-12.6/bin:$PATH export LD_LIBRARY_PATH/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH保存退出后使配置立即生效source ~/.bashrc验证CUDA是否安装成功nvcc -V如果看到类似下面的输出说明CUDA安装正确nvcc: NVIDIA (R) Cuda compiler Copyright (c) 2005-2023 NVIDIA Corporation Built on Tue_Aug_15_22:09:09_PDT_2023 Cuda compilation tools, release 12.2, V12.2.128 Build cuda_12.2.r12.2/compiler.33191640_04. cuDNN安装深度学习的加速器如果你计划进行深度学习开发cuDNN是必不可少的。首先前往NVIDIA cuDNN下载页面需要注册账号下载与你的CUDA版本匹配的cuDNN Library for Linux.tar.xz格式。假设你下载的是cudnn-linux-x86_64-9.9.0.52_cuda12-archive.tar.xz安装步骤如下tar -xvf cudnn-linux-x86_64-9.9.0.52_cuda12-archive.tar.xz sudo cp cudnn-linux-x86_64-9.9.0.52_cuda12-archive/include/cudnn*.h /usr/local/cuda-12.6/include sudo cp -P cudnn-linux-x86_64-9.9.0.52_cuda12-archive/lib/libcudnn* /usr/local/cuda-12.6/lib64 sudo chmod ar /usr/local/cuda-12.6/include/cudnn*.h /usr/local/cuda-12.6/lib64/libcudnn*5. 常见问题与解决方案即使按照上述步骤操作你可能还是会遇到一些问题。以下是一些常见问题及其解决方法问题1安装驱动后无法进入图形界面解决方法尝试使用不同的驱动版本或者使用sudo apt purge nvidia*彻底清除驱动后重新安装问题2nvidia-smi命令找不到可能原因驱动未正确安装解决方法重新安装驱动并确保重启系统问题3CUDA程序运行时提示库文件找不到解决方法检查你的LD_LIBRARY_PATH是否设置正确特别是路径中的CUDA版本号问题4多个CUDA版本如何管理解决方法可以通过修改~/.bashrc中的路径来切换不同版本的CUDA例如# 使用CUDA 12.6 export PATH/usr/local/cuda-12.6/bin:$PATH export LD_LIBRARY_PATH/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH # 使用CUDA 11.8时注释上面的行取消注释下面的行 # export PATH/usr/local/cuda-11.8/bin:$PATH # export LD_LIBRARY_PATH/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH记住每次修改.bashrc后都需要执行source ~/.bashrc使更改生效。

更多文章