nivida-smi查看显卡驱动版本
(一)安装CUDA
cuda官网
cuda官网
下载对应版本的cuda
这个官网真不错啊,下面附上了指令
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-ubuntu2404-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2404-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2404-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
验证是否安装cuda成功
nvcc -V
#或者
nvcc --version
然后就发现啥都没有
一查原来是没有配置环境变量
如果是自带的cuda安装(sudo apt install nvidia-cuda-toolkit),会给你配好环境变量的,但自己去官网下载需要自己配置环境变量
配置环境变量(让 nvcc 可用)
1)编辑 ~/.bashrc:
nano ~/.bashrc
2)在文件末尾添加:
export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
保存并退出(Ctrl + X → Y → Enter)。
3)使更改生效
source ~/.bashrc
4)验证 nvcc
nvcc -V
现在应该能正确显示 CUDA 12.8 的版本信息。
nvidia官网往下翻,还看到教我怎么安装显卡驱动的指令哎,开源的或者传统版本
(二)安装cudnn
官网
cudnn官网
1)附有指令
wget https://developer.download.nvidia.com/compute/cudnn/9.10.2/local_installers/cudnn-local-repo-ubuntu2404-9.10.2_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.10.2_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.10.2/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn
2)验证 cuDNN 是否被正确识别
检查文件是否在 CUDA 目录中
运行以下命令,确认 cuDNN 的头文件和库文件已存在:
# 检查头文件
ls /usr/local/cuda/include/cudnn*.h
# 检查库文件
ls /usr/local/cuda/lib64/libcudnn*
正常情况会输出类似:
/usr/local/cuda/include/cudnn_version.h
/usr/local/cuda/lib64/libcudnn.so.8
/usr/local/cuda/lib64/libcudnn.so.8.9.4
果不其然,我的又是找不到
解决措施如下:
手动创建符号链接到 CUDA 目录(推荐)
将 cuDNN 的头文件和库文件链接到 CUDA 的默认路径,这样编译器和深度学习框架会自动找到它们。
1. 链接头文件
sudo ln -s /usr/include/cudnn.h /usr/local/cuda/include/cudnn.h
sudo ln -s /usr/include/cudnn_version.h /usr/local/cuda/include/cudnn_version.h
2. 链接库文件
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so /usr/local/cuda/lib64/libcudnn.so
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so.8 /usr/local/cuda/lib64/libcudnn.so.8
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so.8.x.x /usr/local/cuda/lib64/libcudnn.so.8.x.x # 替换 x.x 为具体版本号
3. 更新动态链接库缓存
sudo ldconfig
验证链接是否成功
ls -l /usr/local/cuda/include/cudnn* # 检查头文件链接
ls -l /usr/local/cuda/lib64/libcudnn* # 检查库文件链接
如果显示链接已创建(如 cudnn.h -> /usr/include/cudnn.h),说明操作成功。
(三)下载对应的torch 和torchision
torch官网
下载torch官网
我下的是python3.8的,感觉3.8稳定好用
注意:torch torchvision cuda要对应好各自的版本,我的cuda虽然是12.8但是在这里没找到比121更高的版本了。
(四)安装miniconda
指令
# 删除旧安装(如果存在)
rm -rf /home/shangshuiai/miniconda3#shangshuiai是我自己的目录,你们替换成自己的# 下载并安装 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p /home/shangshuiai/miniconda3
#shangshuiai是我自己的文件夹目录,你们替换成自己的