centos7.9 安装nvidia驱动 及 CUDA Toolkit 开发工具包

【注意:此文章为博主原创文章!转载需注意,请带原文链接,至少也要是txt格式!】
CentOS7.9 Nvidia驱动安装前准备工作
Nvidia驱动安装环境依赖
在安装nvidia驱动之前,需要做比较多的工作,而且还有很多注意事项。首先必须安装gcc依赖。
yum install gcc -y
yum -y install dkms
这里也要注意,安装完后一定一定要看一下gcc的版本,如果是gcc version 4.8.5 20150623 (Red Hat 4.8.5-44)
那就太老旧了。
这里建议安装gcc version 8.5.0 20210514 (Red Hat 8.5.0-4)
当然了,具体看自己情况,更高一些也可以,但是不建议太高。安装gcc的方法参考:CentOS 7 升级gcc 到指定版本
然后安装kenerl
、kernel-header
、kernel-devel
,这里就有一个点一定要注意,内核版本kenerl与kernel-header和kernel-devel的版本不一致的问题,所以,安装的时候,一定要一致,避免不必要的问题。
首先可以通过uname -r
来查看系统当前版本。如下图:
可以看到,我当前系统内核版本是3.10.0。
rpm -qa kernel-headers
(查看kernel-headers版本)
rpm -qa kernel-devel
(查看kernel-devel版本)
这里可以看到,明显不一致,那么更新、安装的时候一定要注意,就要安装3.10.0版本。
不过首先需要将不一致的版本协助掉!!!需要将安装的kenerl与kernel-header和kernel-devel卸载:
#yum remove kernel-你自己的kernel版本(卸载kernel)
#yum remove kernel-headers-你自己的kernel-devel版本(卸载kernel-headers)
#yum remove kernel-devel-你自己的kernel-devel版本(卸载kernel-devel)
###以我的系统为例,那么我执行的命令就是:
yum remove kernel-4.18.0
yum remove kernel-headers-4.18.0
yum remove kernel-devel-4.18.0
卸载过后重新安装kenerl与kernel-header和kernel-devel
##安装kernel
yum install kernel-$(uname -r)
##安装kernel-headers
yum install kernel-headers-$(uname -r)
##安装kernel-devel
yum install kernel-devel-$(uname -r)
再次查看内核版本kenerl与kernel-header和kernel-devel的版本,一致!
重启reboot
至此部分环境依赖工作已经准备完毕。可以进行下一步。
centos7 Nvidia驱动安装所需配置
首先需要添加yum源,具体方法如下:
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
添加之后,安装nvidia-detect,并查看适用的版本(这里我本人仅做查看,并未使用在线安装驱动,主要是版本选择问题不明确),所以我是手动安装驱动,但是需要看一下当前主机支持的各驱动版本。
yum install nvidia-detect
nvidia-detect
yum search kmod-nvidia
这里注意,如果采用在线安装,无需估计版本问题,一般选择最新即可,从图得到四个centos7.9适合的驱动版本,第一个kmod-nvidia.x86_64依然是515版本,安装后会重启黑屏。选择470版本进行安装
yum -y install kmod-nvidia-470xx.x86_64
安装完成后,执行nvidia-smi
下一步,需要禁用Centos7的nouveau,命令是vim /lib/modprobe.d/dist-blacklist.conf
将nvidialib注释,并添加如下代码:
blacklist nouveau
options nouveau modeset=0
然后是重塑
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
然后重启机器reboot
,重启后要检查一下,下面是检查命令:
lsmod | grep nouveau
如果没有东西打印说明成功禁用nouveau!恭喜基本步骤都已完成!!!
CentOS7.9 Nvidia驱动官网驱动选择
首先查看一下当前显卡的型号,命令是lspci | grep NVIDIA
,然后我的是如下图:
00:03.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100S PCIe 32GB] (rev a1)
这里可以了解到我的显卡是Tesla然后是V系列中的V100S,这里就去https://www.nvidia.com/Download/index.aspx官网开始查找驱动吧,如下图:
然后点击搜索,如下图:
然后下载即可,会有连接,你也可以在服务器中用 wget 命令下载。
然后就是chmod +775 NVIDIA-Linux-x86_64-515.105.01.run
然后运行即可。
这里运行过程中,可能需要注意,有的地方需要点yes,如果你要不懂,都点yes即可。
最后就是大功告成!!!执行命令:nvidia-smi
到这里,驱动算是完成了,下一步安装CUDA Toolkit、CuDNN,这一步也是非常简单
centos7 安装CUDA Toolkit
首先安装cuda toolkit要进行AI计算的时候一定要注意驱动版本。这里可以查看版本对应:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
这里就很明确,我们需要进入到:https://developer.nvidia.com/cuda-toolkit-archive
找到自己对应的版本:
这里额外说一句,其实11.7.0也可以。
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run
就是简单的下一步,就可以安装完毕了。。其实至此,基本上就是全部安装完毕了。
不过最后还有一个环境变量,这个设置不设置都可以的。如果要是设置参考:
vim ~/bashrc
source ~/.bashrc
centos7 安装 NVIDIA cuDNN
如果你还需要神经网络训练学习,那么还需要安装cuDNN,这个方法也比较简单。
选择CUDA相匹配的版本,我们是CUDA版本是11.7,NVIDIA官网上没有匹配,选择
Download cuDNN v8.4.0 (April 1st, 2022), for CUDA 11.x
下载https://developer.nvidia.com/rdp/cudnn-archive
然后把文件用wget方式 下到指定的目录。然后执行下面的命令:
tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/include/cudnn*.h /usr/local/cuda/include
cp -P cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/lib/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
到这里显卡及AI运算神经网络的相关驱动都已安装完毕。
这里有一个点一定要注意,就是安装PyTorch https://pytorch.org/get-started/locally/ 一定要安装对应版本。
对了,再友情提示一下,位了避免出现问题,建议安装下面两个东西:
yum install libX11
yum install libXext
布施恩德可便相知重
微信扫一扫打赏
支付宝扫一扫打赏