重点!要先做好版本调研,从要安装的Tensorflow版本出发,看需要的CUDA版本,cuDNN版本,在选择CUDA和cuDNN时,查看支持的Ubuntu系统。
1.查看Tensorflow版本及所需CUDA,cuDNN版本


[Tensorflow GPU support]
https://tensorflow.google.cn/install/gpu
其中的
Software requirements

Sofware requirements,网站截图


2.下载CUDA版本,
选择CUDA版本
下载runfile版本,依照图中选择Ubuntu版本
CUDA9.0
https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
3.
cuDNN7.4.2
https://developer.nvidia.com/rdp/cudnn-download
4.
依据CUDA版本选择Ubuntu版本

Ubuntu中打开终端
Ctrl+Alt+t

安装python及常用库

sudo apt install python3#安装python3
python3 -V#查看python版本
sudo apt install python3-pip#安装pip
pip3 install numpy#安装numpy
pip3 install sklearn#安装sklearn
pip3 install matplotlib#安装matplotlib
pip3 install pandas#安装pandas

安装spyder环境

安装后打开有问题试试重启终端

pip3 install spyder#安装spyder
pip3 install -U pyqt5
sudo apt-get install ipython3
sudo pip3 install ipython
spyder3#打开spyder

安装jupyter notebook

安装后打开有问题试试重启终端

pip3 install jupyter#安装jupyter
jupyter notebook#打开jupyter

安装其他库

#安装BLAS库
sudo apt-get install build-essential cmake git unzip pkg-config libopenblas-dev liblapack-dev
#安装yaml
sudo apt-get install python3-yaml
#安装h5py
sudo apt-get install libhdf5-serial-dev python3-h5py
#安装Graphviz和pydot-ng
sudo apt-get install graphviz
sudo apt-get install pydot-ng
#安装opencv
sudo apt-get install  python3-opencv

安装Tensorflow GPU依赖

sudo apt update
sudo apt install python3-dev python3-pip
sudo pip3 install -U virtualenv # system-wide install
安装NVIDIA驱动

根据安装的显卡和系统下载驱动
https://www.nvidia.cn/Download/index.aspx?lang=cn

参考教程,可不看,下文中都有
https://blog.csdn.net/u014797226/article/details/80229887
https://blog.csdn.net/u014797226/article/details/79626693

禁用第三方驱动

sudo gedit /etc/modprobe.d/blacklist.conf#打开编辑配置文件
#在最后一行添加blacklist nouveau
sudo update-initramfs -u#改好后执行命令
#重启使之生效
reboot

给驱动赋予执行权限

sudo chmod a+x NVIDIA-Linux-x86_64-410.93.run#下载的驱动文件名
sudo ./NVIDIA-Linux-x86_64-410.93.run -no-opengl-files#安装

重启,

reboot

输入命令:

nvidia-smi

如果出现了驱动版本就表示安装成功了

安装CUDA
sudo init 3#远程关闭X服务,默认为init 2
chmod u+x cuda_9.0.176_384.81_linux.run#设置为可执行
sudo ./cuda_9.0.176_384.81_linux.run --override#不安装driver,因为前面已经安装,不安装sample

设置环境变量
安装完成以后,需要把cuda路径添加到当前用户的配置文件里:

sudo gedit ~/.bashrc
#将安装路径添加到文件末尾:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

运行,使其生效

source ~/.bashrc

多用户
在系统的 etc 目录下,有一个 profile 文件,编辑该文件:
s u d o g e d i t / e t c / p r o f i l e 在 最 后 边 加 入 需 要 设 置 变 量 的 s h e l l 语 句 , 例 如 : e x p o r t P A T H = / u s r / l o c a l / c u d a − 9.0 / b i n : sudo gedit /etc/profile 在最后边加入需要设置变量的shell语句,例如: export PATH=/usr/local/cuda-9.0/bin: sudogedit/etc/profileshellexportPATH=/usr/local/cuda9.0/bin:PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH该文件编辑保存后,重启系统,变量生效。
该方式添加的变量对所有的用户都有效。
如果使其立即生效: source /etc/profile

nvcc -V #查看版本,验证是否安装成功
#输出:
#nvcc: NVIDIA (R) Cuda compiler driver
#Copyright (c) 2005-2017 NVIDIA Corporation
#Built on Fri_Sep__1_21:08:03_CDT_2017
#Cuda compilation tools, release 9.0, V9.0.176
安装cuDNN
sudo dpkg -i libcudnn7_7.4.2.24-1+cuda9.0_amd64.deb#安装cuDNN
sudo dpkg -i libcudnn7-dev_7.4.2.24-1+cuda9.0_amd64.deb

安装Tensorflow

sudo pip3 install tensorflow-gpu#安装gpu版tensorflow
测试Tensorflow
#测试tensorflow
#在spyder或终端中python3
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '0'
os.environ["CUDA_VISIBLE_DEVICES"] ='0'
import tensorflow as tf
hello = tf.constant('Hello Tensorflow')
sess = tf.Session()
print(sess.run(hello))

安装keras

sudo pip3 install keras#安装keras

还原显示,重启第三方驱动
打开编辑配置文件: sudo gedit /etc/modprobe.d/blacklist.conf
在最后一行删除:blacklist nouveau
改好后执行命令:sudo update-initramfs -u
重启使之生效:reboot
还原初始化模式
sudo init 2

Logo

欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。

更多推荐