A-A+

centos7.9 安装nvidia驱动 及 CUDA Toolkit 开发工具包

2023年04月24日 20:06 学习笔记 暂无评论 共3674字 (阅读1,387 views次)

【注意:此文章为博主原创文章!转载需注意,请带原文链接,至少也要是txt格式!】

CentOS7.9 Nvidia驱动安装前准备工作

Nvidia驱动安装环境依赖

在安装nvidia驱动之前,需要做比较多的工作,而且还有很多注意事项。首先必须安装gcc依赖。

yum install gcc -y
yum -y install dkms

这里也要注意,安装完后一定一定要看一下gcc的版本,如果是gcc version 4.8.5 20150623 (Red Hat 4.8.5-44)那就太老旧了。

这里建议安装gcc version 8.5.0 20210514 (Red Hat 8.5.0-4) 当然了,具体看自己情况,更高一些也可以,但是不建议太高。安装gcc的方法参考:CentOS 7 升级gcc 到指定版本
images

然后安装kenerlkernel-headerkernel-devel,这里就有一个点一定要注意内核版本kenerl与kernel-header和kernel-devel的版本不一致的问题,所以,安装的时候,一定要一致,避免不必要的问题。

首先可以通过uname -r来查看系统当前版本。如下图:

images

可以看到,我当前系统内核版本是3.10.0。

rpm -qa kernel-headers (查看kernel-headers版本)

rpm -qa kernel-devel (查看kernel-devel版本)

images

这里可以看到,明显不一致,那么更新、安装的时候一定要注意,就要安装3.10.0版本。

不过首先需要将不一致的版本协助掉!!!需要将安装的kenerl与kernel-header和kernel-devel卸载:

#yum remove kernel-你自己的kernel版本(卸载kernel)
#yum remove kernel-headers-你自己的kernel-devel版本(卸载kernel-headers)
#yum remove kernel-devel-你自己的kernel-devel版本(卸载kernel-devel)
###以我的系统为例,那么我执行的命令就是:

yum remove kernel-4.18.0
yum remove kernel-headers-4.18.0
yum remove kernel-devel-4.18.0

卸载过后重新安装kenerl与kernel-header和kernel-devel

##安装kernel
yum install kernel-$(uname -r)

##安装kernel-headers
yum install kernel-headers-$(uname -r)

##安装kernel-devel
yum install kernel-devel-$(uname -r)

再次查看内核版本kenerl与kernel-header和kernel-devel的版本,一致!images

重启reboot

至此部分环境依赖工作已经准备完毕。可以进行下一步。

centos7 Nvidia驱动安装所需配置

首先需要添加yum源,具体方法如下:

rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

添加之后,安装nvidia-detect,并查看适用的版本(这里我本人仅做查看,并未使用在线安装驱动,主要是版本选择问题不明确),所以我是手动安装驱动,但是需要看一下当前主机支持的各驱动版本。

yum install nvidia-detect
nvidia-detect
yum search kmod-nvidia

images

这里注意,如果采用在线安装,无需估计版本问题,一般选择最新即可,从图得到四个centos7.9适合的驱动版本,第一个kmod-nvidia.x86_64依然是515版本,安装后会重启黑屏。选择470版本进行安装
yum -y install kmod-nvidia-470xx.x86_64安装完成后,执行nvidia-smi

images
安装成功。reboot重启,安装完成。  因为我没有采用这个引用的方法,所以我都加了横线,这里只是为了懒人准备!

 

下一步,需要禁用Centos7的nouveau,命令是vim /lib/modprobe.d/dist-blacklist.conf将nvidialib注释,并添加如下代码:

blacklist nouveau
options nouveau modeset=0

然后是重塑

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)

然后重启机器reboot,重启后要检查一下,下面是检查命令:

lsmod | grep nouveau

如果没有东西打印说明成功禁用nouveau!恭喜基本步骤都已完成!!!

CentOS7.9 Nvidia驱动官网驱动选择

首先查看一下当前显卡的型号,命令是lspci | grep NVIDIA,然后我的是如下图:

images

00:03.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100S PCIe 32GB] (rev a1)

这里可以了解到我的显卡是Tesla然后是V系列中的V100S,这里就去https://www.nvidia.com/Download/index.aspx官网开始查找驱动吧,如下图:

images

然后点击搜索,如下图:

images

然后下载即可,会有连接,你也可以在服务器中用 wget 命令下载。

然后就是chmod +775 NVIDIA-Linux-x86_64-515.105.01.run 然后运行即可。images

这里运行过程中,可能需要注意,有的地方需要点yes,如果你要不懂,都点yes即可。

最后就是大功告成!!!执行命令:nvidia-smi

images

到这里,驱动算是完成了,下一步安装CUDA Toolkit、CuDNN,这一步也是非常简单

centos7 安装CUDA Toolkit

首先安装cuda toolkit要进行AI计算的时候一定要注意驱动版本。这里可以查看版本对应:

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

images

这里就很明确,我们需要进入到:https://developer.nvidia.com/cuda-toolkit-archive

找到自己对应的版本:

images

这里额外说一句,其实11.7.0也可以。

images

 

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run

 

就是简单的下一步,就可以安装完毕了。。其实至此,基本上就是全部安装完毕了。

不过最后还有一个环境变量,这个设置不设置都可以的。如果要是设置参考:

vim ~/bashrc
source ~/.bashrc

 

添加如下信息,注意路径哦!!!
images

验证CUDA ToolKit是否安装成功nvcc -V images

 

centos7 安装 NVIDIA cuDNN

如果你还需要神经网络训练学习,那么还需要安装cuDNN,这个方法也比较简单。

选择CUDA相匹配的版本,我们是CUDA版本是11.7,NVIDIA官网上没有匹配,选择
Download cuDNN v8.4.0 (April 1st, 2022), for CUDA 11.x

下载https://developer.nvidia.com/rdp/cudnn-archive

images

然后把文件用wget方式 下到指定的目录。然后执行下面的命令:

tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/include/cudnn*.h /usr/local/cuda/include
cp -P cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/lib/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

如出现以下输出,则安装成功。images

到这里显卡及AI运算神经网络的相关驱动都已安装完毕。

 

这里有一个点一定要注意,就是安装PyTorch    https://pytorch.org/get-started/locally/  一定要安装对应版本。

 

对了,再友情提示一下,位了避免出现问题,建议安装下面两个东西:

yum install libX11
yum install libXext

布施恩德可便相知重

微信扫一扫打赏

支付宝扫一扫打赏

×

给我留言