安装ubuntu20.4+gtx1050+cuda11.3
前言
系統安裝已經寫了很多博客。本片是試圖用一個比較老的GPU卡和新的操作系統Ubuntu20.04,以及新的CUDA版本進行安裝。試圖找出CUDA安裝的總規律。期望大家通過本篇可以知道對任意Nvidia卡和任意操作系統,以及任意的cuda安裝有一個基本的原則和思路。
1 背景知識:
安裝cuda,需要記住若干的要點
CUDA開發環境依賴于與主機開發環境(包括主機編譯器和C運行時庫)的緊密集成,因此,有如下要點,安裝者必須清楚:
1)ubuntu版本不同,安裝差別很大,安裝步驟出錯后,不能前后借鑒。
2)cuda在11.0之前和之后差別很大,11.0之后必須給出依賴名字。
3)安裝cuda-toolkit文件必須挑選能和驅動匹配的。
4)c和c++一般需要注意,要求高版本就行。
5)系統清除必須干凈,否則后患無窮。nouveau
6)? 內核(和驅動)與CUDA的關系:
????? 內核版本號 == 驅動版本號 == CUDA所指驅動版本號
以上三者必須是一致的。
如果看了上圖還不明白啥意思,那就請比較下面兩個圖:
?
?上面兩個圖的版本信息的一致性。
2 系統檢查
系統檢查很重要,系統安裝成否,系統有那些不匹配,必須有相關的檢測語句完成檢測。
- Verify the system has a CUDA-capable GPU.
- Verify the system is running a supported version of Linux.
- Verify the system has gcc ,g++,make installed.
- Verify the system has the correct kernel headers and development packages installed.
- Download the NVIDIA CUDA Toolkit.
- Handle conflicting installation methods.
1)查看顯卡驅動所使用的內核版本
cat /proc/driver/nvidia/version2)系統驅動安裝日志
cat /var/log/dpkg.log | grep nvidia3)查看驅動程序包
sudo dpkg --list | grep nvidia-*3 系統清除
清除的要點是必須要干凈。清除以前的安裝很重要,有時清理不干凈,后面就不能正確安裝:
1)清除cuda
另外,安裝不上是常態,如何清除已經安裝了一半的廢墟?清除已安裝的cuda官方提示語句:
sudo apt-get --purge remove "*cublas*" "*cufft*" "*curand*" \"*cusolver*" "*cusparse*" "*npp*" "*nvjpeg*" "cuda*" "nsight*"2)清除Nvidia驅動程序
實際上未必清理干凈,需要以下語句補充:
( sudo /usr/bin/nvidia-uninstall ) -------- runfile包適用,deb包不適用
sudo? apt-get? --purge? remove? "*nvidia*"
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
sudo apt autoremove
執行以上語句后,結果檢查,以下語句執行后無內容:
sudo dpkg --list | grep nvidia-*Installation Guide Linux :: CUDA Toolkit Documentation
4 驅動程序選擇和安裝
1) 檢查系統的推薦
ubuntu-drivers devices
以上推薦了幾個版本:【470,460,450】,可以按照提示,下載相應的驅動版本。注意,這里推薦的470不一定能使,建議下載幾個版本供嘗試使用。
2) 下載nvidia驅動程序
進入以下地址可以選擇多種版本:官方 GeForce 驅動程序 | NVIDIA
官方提供的安裝步驟:
- Verify the system has a CUDA-capable GPU.
- Verify the system is running a supported version of Linux.
- Verify the system has gcc installed.
- Verify the system has the correct kernel headers and development packages installed.
- Download the NVIDIA CUDA Toolkit.
- Handle conflicting installation methods.
還有一個下載地址提供最新版本,但很全,比如T4的驅動:
Download Drivers | NVIDIA
按照要求,填寫你的板卡信息:
?點擊:開始搜索后,出現很多驅動版本,挑選最新的下載。
ros古月學院
?下載后文件為:NVIDIA-Linux-x86_64-470.74.run,暫時保存,留在第n步使用。
目前未被淘汰的版本有:
| 470 | 74 | 465 | 31 |
| 63 | 27 | ||
| 57 | 24 | ||
| 460 | 91 | 455 | 45 |
| 84 | 38 | ||
| 80 | 28 | ||
| 73 | |||
| 435 | 21 | 415 | 27 |
3)安裝驅動
sudo chmod? a+x? NVIDIA-Linux-x86_64-470.74.run
./ NVIDIA-Linux-x86_64-470.74.run
reboot
1 進入低級分辨狀態,2 進入root權限 ?? 3 執行NVIDIA-Linux-x86_64-470.74.run文件???? 4 進入選項:
The distribution-provided pre-install script failed! Are you sure you want to continue? 選擇 yes 繼續。 Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 選擇 No 繼續。 問題沒記住,選項是:install without signing 問題大概是:Nvidia's 32-bit compatibility libraries? 選擇 No 繼續。 Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 選擇 Yes?reboot
git clone https://github.com/ros-infrastructure/rosdep系統進入高分辨率狀態,表明驅動完成。
4 禁用nouveau驅動
有的時候需要禁止nouveau;當
1) 將開源驅動加入黑名單
在blacklist.conf的末尾添加
sudo vim /etc/modprobe.d/blacklist.conf末尾追加:
blacklist nouveau blacklist lbm-nouveau options nouveau modeset=0 alias nouveau off alias lbm-nouveau off禁用nouveau驅動4 )禁用nouveau驅動?
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf2)更新并重啟
sudo update-initramfs -u reboot5 安裝cuda11.3版本
1)查看驅動和cuda的配套版本:
CUDA Toolkit 11.3 Downloads | NVIDIA Developer
Release Notes :: CUDA Toolkit Documentation
2)按照官方指導,一步一步安裝。
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda-repo-ubuntu2004-11-3-local_11.3.0-465.19.01-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2004-11-3-local_11.3.0-465.19.01-1_amd64.deb sudo apt-key add /var/cuda-repo-ubuntu2004-11-3-local/7fa2af80.pub sudo apt-get update sudo apt-get -y install cuda3)測試CUDA的samples
cd /usr/local/cuda/samples/1_Utilities/deviceQuery #由自己電腦目錄決定 make sudo ./deviceQuery有result=ok就算成功!
文章參考:
Nvidia 顯卡 Failed to initialize NVML Driver/library version mismatch 錯誤解決方案_zywvvd的博客-CSDN博客
Ubuntu 19.04 server版本安裝RTX 2070顯卡驅動錯誤:The Nouveau kernel driver is currently in use by your sys... - 簡書
?
總結
以上是生活随笔為你收集整理的安装ubuntu20.4+gtx1050+cuda11.3的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ROS知识: vanilla(香草) C
- 下一篇: ROS知识【7】:ubuntu环境如何卸