当前位置：首页 >

centos离线安装(升级)nvidia显卡驱动及cuda10.2

发布时间：2023/12/20 102 豆豆

生活随笔收集整理的这篇文章主要介绍了 centos离线安装(升级)nvidia显卡驱动及cuda10.2 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

一.显卡驱动安装

硬件状况：nvidia 1080Ti显卡

系统：centos7.6.1810

需要的环境：可以连公网

需要下载cuda_8.0.61_375.26_linux.run、NVIDIA-Linux-x86_64-450.80.02.run

显卡驱动下载地址：https://www.nvidia.cn/Download/index.aspx?lang=cn

cuda下载地址： https://developer.nvidia.com/cuda-toolkit

准备工作

1.安装编译环境依赖包

--- yum install epel-release gcc gcc-c++ make cmake dkms -y

2.确认自己的内核版本与kernel-devel的版本一致

--- uname -r

--- yum list | grep kernel-devel

如果不一致的时候，需要yum update,之后再看是否一致

3.安装kernel（根据实际情况选做，如果2的结果一致可不做）

--- yum install kernel-devel.x86_64 kernel.x86_64 -y

#最好加上kernel(此命令偶尔不管用），我遇到过当前的kernel版本跟安装的kernel-devel版本不一致无法安装驱动的情况

4.修改/etc/modprobe.d/blacklist.conf 文件，以阻止 nouveau 模块的加载

--- vim /lib/modprobe.d/dist-blacklist.conf （当该文件存在时）

#将nvidiafb注释掉。

#blacklist nvidiafb

#然后添加以下语句

blacklist nouveau

noptions nouveau modeset=0

当改文件不存在时，直接执行：echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

5.重新建立initramfs image文件

--- mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

--- dracut /boot/initramfs-$(uname -r).img $(uname -r)

--- systemctl set-default multi-user.target

--- reboot #重启

重启后执行：

--- lsmod |grep nouveau ###查看是否还有nouveau相关的进程，正常情况下是没有的。

6.安装驱动

下载驱动文件，并修改文件执行权限

--- chmod +x 文件名

运行驱动文件安装

--- ./NVIDIA-XXXX.run --kernel-source-path=/usr/src/kernels/内核号 #uname -r 查看自己内核版本号，然后填写对应的版本号目录

7.验证显卡是否装成功

--- nvidia-smi

问题描述及解决：

4）若显示“cc”找不到，需要到/usr/local/bin里为gcc创建软连接cc.

5）若没有kernel-devel,需安装内核对应的开发包，内核版本查看uanme –r。

6）编译kernel如果遇到CONFIG_RETPOLINE的错误，说明gcc不支持，需要将Makefile里的下面这段注释掉。

# Avoid indirect branches in kernel to deal with Spectre#ifdef CONFIG_RETPOLINE# RETPOLINE_CFLAGS += $(call cc-option,-mindirect-branch=thunk-extern -mindirect-branch-register)# ifneq ($(RETPOLINE_CFLAGS),)# KBUILD_CFLAGS += $(RETPOLINE_CFLAGS) -DRETPOLINE# else# $(error CONFIG_RETPOLINE=y, but not supported by the compiler. Compiler update recommended.)# endif#endif

ERROR: Unable to load the 'nvidia-drm' kernel module.

如果能够搜索到nvidia-drm，重启机器就可以重新加载了。

ERROR:An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel.

使用lsmod | grep -i nvidia可以查看当前与nvidia驱动有个的模块。

然后，如果存在nvidia-uvm的错误，说明某个进程还在使用nvidia-uvm，需要使用命令lsof | grep nvidia.uvm

查看是哪个进程，然后kill掉。

二.显卡驱动升级

下载显卡驱动

https://www.nvidia.cn/Download/index.aspx?lang=cn

上传驱动文件到服务器

给驱动文件加载执行权限

chmod +x NVIDIA-Linux-x86_64-440.82.run

2.卸载旧版本驱动

./NVIDIA-XXXX.run –uninstall

验证是否卸载彻底：nvidia-后table如果有nvidia-smi表示没有完全卸载，执行下面命令

apt-get remove --purge nvidia-\*

3.安装驱动：

--- ./NVIDIA-XXXX.run --kernel-source-path=/usr/src/kernels/内核号 #uname -r 查看自己内核版本号，然后填写对应的版本号目录

三.安装cuda10.2

1.安装

--- ./cuda_10.2.89_440.33.01_linux.run

2.如下是安装cuda10.2时的选择：

会出现安装界面，输入accept

3. 配置全局用户的环境变量

--- vim /etc/profile

添加以下内容：

export PATH=$PATH:/usr/local/cuda-10.2/bin

export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH

--- source /etc/profile

添加内容里的路径根据自己安装cuda的实际位置做修改

4. 配置全局的cuda库环境

--- vim /etc/ld.so.conf.d/cuda-10-2.conf

添加以下内容：

/usr/local/cuda-10.2/lib64

/usr/local/cuda-10.2/lib

--- ldconfig

添加内容里的路径根据自己安装cuda的实际位置做修改

5.配置普通用的环境变量（若配置了全局的用户变量，下面操作可不操作）

-- vim ~/.bashrc

添加以下内容：

export PATH=/usr/local/cuda-8.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

--- source ~/.bashrc

6.验证安装是否成功

--- nvcc -V #验证是否安装成功。

总结

以上是生活随笔为你收集整理的centos离线安装(升级)nvidia显卡驱动及cuda10.2的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：最简单完整的libwebsockets的
下一篇： kiel实现c语言编程,单片机实验1(K