ubuntu 16.0.4 配置 tensorflow-gpu 1.1.0
今天配了一下tensorflow的gpu版本,感覺有幾個坑,網上的資料也比較亂,就想給大家留個比較完整安裝和排坑的文檔。
我的gpu是gtx 960m
1.安裝驅動
沒有安裝驅動應該是選擇x server的,應該也有一個NVIDIA的選項,我試過從這里更改,失敗了,應該是源的網速不好,或是缺依賴。
網上有很多教程說什么禁用x server 什么的感覺很麻煩,而且不是很靠譜,直接用ppa這個方法比較簡單,我選的版本是375,其他版本沒有測試。
?
?
1 sudo add-apt-repository ppa:graphics-drivers/ppa 2 sudo apt-get update && sudo apt-get install nvidia-375出現問題就試試 --fix-missing
安裝后可以重啟,也可以不重啟,我沒有重啟,不過后來重啟關機大概15分鐘左右。
安裝后,可以在這里查看
?
2.安裝cuda
https://developer.nvidia.com/cuda-downloads
選擇對應版本,.deb安裝簡單
Installation Instructions:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb sudo apt-get update sudo apt-get install cuda我安裝的時候,什么都沒有填,直接安裝好了
3.安裝cuDNN
https://developer.nvidia.com/rdp/cudnn-download
要注冊賬號
這里注意下,我一開始下載了v6版本,但tensorflow-gpu 1.1.0 版本需要v5版本。我下載的cuDNN v5 (May 27, 2016), for CUDA 8.0
下載后解壓到安裝路徑,理論上哪里都行,我放在home下。
ALL PLATFORMS
Extract the cuDNN archive to a directory of your choice, referred to below as <installpath>.
Then follow the platform-specific instructions as follows.
LINUX
cd <installpath>
export LD_LIBRARY_PATH=`pwd`:$LD_LIBRARY_PATH
Add <installpath> to your build and link process by adding -I<installpath> to your compile
line and -L<installpath> -lcudnn to your link line.
這是官方安裝教程。
也就是這個部分出現了最多的問題。
我也記不清楚具體步驟,只能說下我出現的幾個錯誤
>>> import tensorflow Traceback (most recent call last):File "<stdin>", line 1, in <module>File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/__init__.py", line 24, in <module>from tensorflow.python import *File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/__init__.py", line 51, in <module>from tensorflow.python import pywrap_tensorflowFile "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 52, in <module>raise ImportError(msg) ImportError: Traceback (most recent call last):File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 41, in <module>from tensorflow.python.pywrap_tensorflow_internal import *File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 28, in <module>_pywrap_tensorflow_internal = swig_import_helper()File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 24, in swig_import_helper_mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description) ImportError: libcudnn.so.5: cannot open shared object file: No such file or directoryFailed to load the native TensorFlow runtime.首先是要把所有cudnn文件考到cuda中,而似乎這里只用到了libcudnn.so.5
sudo cp cuda/include/cudnn.h /usr/local/cuda/include后面我是先把/home/kai/cuda/lib64下的所有文件cp過去,出現上面的錯誤。
sudo cp cuda/lib64/libcudnn_static.a /usr/local/cuda/lib64sudo ldconfig /usr/local/cuda/lib64
用這個命令確認一下
看來libcudnn.so.5必須是一個鏈接。
sudo ln -s /home/kai/cuda/lib64/libcudnn.so.5 libcudnn.so.5 #pwd = /usr/local/cuda/lib64再試一下,成功
?
ps:我在前面改了libcudnn.so.5的權限,不過不清楚有沒有作用,如果按上面過程出現問題,可以改下權限,移除鏈接,再重新創建鏈接。
sudo chmod u=rwx,g=rx,o=rx libcudnn.so.5 #pwd = 解壓cudnn出來的目錄而且,這個方法我只是成功導入了tensorflow
?
4.安裝tensorflow-gpu
pip install tensorflow-gpu?
轉載于:https://www.cnblogs.com/dk666/p/6761562.html
總結
以上是生活随笔為你收集整理的ubuntu 16.0.4 配置 tensorflow-gpu 1.1.0的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: (一)java多线程之Thread
- 下一篇: 转: 网卡名字eth0,eth1的修改方