1 介绍

本教程将指导您如何在Anaconda环境中安装TensorFlow(CUDA版本),并配置所需的三方组件,包括CUDA Toolkit、cuDNN、protobuf等。(参考b站视频:BV1rd4y187nM)

2 先决条件

  • 已安装Anaconda
  • 了解基础的命令行操作

3 安装前准备

3.1 查看显卡相关信息

安装之前首先查看自己电脑NVIDIA显卡的相关信息

  1. 按下Win + R键打开运行对话框,输入cmd按回车打开命令提示符
  2. 输入以下命令查看自己的NVIDIA显卡的相关信息

如下图所示,了解自己的显卡型号以及CUDA版本信息
在这里插入图片描述

如图所示设备显卡为4060 Ti,CUDA版本为12.5。

3.2 了解工具包版本兼容性

  • 官方建议配置:
    打开TensorFlow官网查询官方建议配置信息,给出的为tensorflow-gpu相对应的Python版本范围,官方建议的cuDNN版本和CUDA的版本要求。
    如图所示,本设备选择相关配置如图红框标注所示:
  • Python选择3.8版本;cuDNN:8.1;CUDA:11.2
    在这里插入图片描述

4 具体步骤

4.1 创建Anaconda虚拟环境

打开Anaconda Prompt输入以下指令创建一个新的虚拟环境tf_gpu,python版本选择3.8版本。

conda create -n tf_gpu python=3.8 -y
conda activate tf_gpu

注意:由于tensorflow对各种工具包之间的版本兼容性要求非常严苛,因此以下CUDA Toolkit、cuDNN、以及TensorFlow都需要严格按照官方推荐版本搭配安装
根据4.3.2所述:Python版本3.8;cuDNN版本8.1;CUDA版本11.2

4.2 安装CUDA Toolkit

CUDA Toolkit是NVIDIA提供的用于GPU计算的工具包,可以在深度学习是进行加速运算。TensorFlow需要特定版本的CUDA。

  1. 首先进入CUDA下载界面,选择CUDA Toolkit 11.2.0Pasted image 20240928210126

  2. 操作环境选择Windows,版本选择10,安装器类型选择exe(local),然后点击下载在这里插入图片描述

  3. 双击,安装程序![][[Pasted image 20240928210540.png]]

  4. 此处路径是文件临时存放路径,任意填写可以不用管![[Pasted image 20240928210701.png]]

  5. 等待安装完成
    ![[Pasted image 20240928210748.png]]

6.点击同意并继续
![[Pasted image 20240928210857.png]]

注意:此处系统检查有可能提示you have installed a higher version of frameview SDK,这是因为之前在安装显卡驱动的时候顺便安装上的,用来检测游戏进行时的显卡性能,到控制面板中放心卸载NVIDIA frameview SDK即可
7. 点击自定义,再点击下一步在这里插入图片描述

  1. 取消CUDA下的Visual Studio Integration以及Driver components下的Display Driver 在这里插入图片描述在这里插入图片描述
  • Visual Studio Integration: 如果不打算在Visual Studio中使用CUDA开发,勾选这个选项并没有必要,它只会增加安装包的大小和复杂性。
  • Display Driver: 通常,您已经有适合的显卡驱动程序,重新安装可能会造成不必要的冲突或问题。保持系统驱动程序更新,避免冗余安装。
  1. 选择安装位置,并记住安装位置,之后会用到在这里插入图片描述

  2. 接下来一直默认下一步即可

4.3 安装cuDNN

  • cuDNN是NVIDIA提供的深度学习库,支持多种神经网络操作。相当于是CUDA的补丁
  1. 首先进入cuDNN的下载页面,选择for CUDA 11.2的cuDNN v8.1.1在这里插入图片描述

下载cuDNN比较麻烦,需要登录NVDIA的账户,没有的新注册一个即可。
2. 将下载好的文件解压,全选复制到上面提到需要记住的CUDA安装根目录(默认为 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2),若有重复文件覆盖即可在这里插入图片描述在这里插入图片描述

4.4 配置系统路径

  • 配置系统路径是为了确保系统和应用程序能够方便地找到和使用CUDA Toolkit和cuDNN,从而保证开发和运行深度学习模型的顺利进行
  1. 按下Win + R键打开运行对话框,输入cmd按回车打开命令提示符

  2. 输入 sysdm.cpl 然后按 Enter,打开系统属性窗口。

  3. 点击高级选项卡,点击环境变量在这里插入图片描述

  4. 点击Path
    在这里插入图片描述

  5. 加入前面对应CUDA的路径在这里插入图片描述

默认为:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\lib
  1. 打开cmd,输入:
nvcc -V

可以看到版本信息,证明配置正确:
在这里插入图片描述

  1. 打开cmd,切换至如下路径,并执行如下两个命令
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\demo_suite
.\bandwidthTest.exe
.\deviceQuery.exe

在这里插入图片描述在这里插入图片描述

两个命令均返回Result = PASS,说明CUDA配置好了

4.5 安装TensorFlow

  • 选择与CUDA版本兼容的TensorFlow2.6.0版本进行安装。
  1. 打开anaconda prompt,进入之前创建的虚拟环境
conda activate tf_gpu
  1. 安装TensorFlow2.6.0版本,推荐使用清华源,速度很块
pip install tensorflow-gpu==2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

注意:不需要特意安装tensorflow-gpu,在tensorflow1.2 版本后系统会自动调用GPU进行加速,不放心的话看一下任务管理器,可以看到底是在占用CPU还是GPU

  • 此处若出现黄色WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) 的提示的话(如下图),一般是代理问题,关闭即可
    在这里插入图片描述
  1. 安装成功后可以看到keras自动安装的版本为2.15.0,而keras需要和tensorflow版本保持一致在这里插入图片描述
    因此需要重新安装keras2.6.0:
pip install keras==2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 安装protobuf包:(如果系统中没有安装protobuf,会导致TensorFlow导入失败)
pip install protobuf==3.20.0

4.6 第六步:验证安装

  • 在Python中验证TensorFlow是否成功安装,并检查GPU是否可用。
  1. 打开anaconda,并且确定进入了先前配置好的虚拟环境:
conda activate tf_gpu
  1. 进入python环境,并且运行测试代码,检验一下安装是否有问题
python 

进入python环境后,逐行输入:

import tensorflow as tf # 导入tensorflow包
tf.config.list_physical_devices('GPU') # 查看当前GPU设备
exit() # 退出python

在这里插入图片描述
显示0号GPU说明显卡设备识别正常

5 三方库安装

  • 由于tensorflow2.6.0版本对三方库的版本有要求(例如numpy版本需在1.19.2版本左右,过高不兼容)
  • 不同三方库之间还存在着错综复杂的依赖关系比如sklearn(scikit-learn)依赖于scipy,而scipy又依赖于numpy。这些库之间的版本关系是相互依赖的。若安装了高版本的scikit-learn,它可能会自带或依赖于高版本scipy,而高版本的scipy可能不支持tensorflow2.6.0要求的低版本的numpy。
  • 并且安装高版本的第三方库可能会强制将之前的低版本的其他库升级…
  • 基于以上,安装时要十分注意每个三方库的版本问题,以实现互相的兼容性。

这里参考网上资料提供一个适用于tensorflow2.6.0的三方库兼容性版本方案,当然其他的配置也可以自行摸索。(参考csdn文章:TensorFlow 2.6.0 解决sklearn、scipy、numpy、pandas等版本问题

  • scipy 1.7.3
  • scikit-learn 0.22.1
  • numpy 1.19.2
  • pandas 1.3.4
  • matplotlib 3.5.2
  • seaborn 0.12.2

安装后可以通过以下命令进行三方库之间的兼容性检查

pip check

若无冲突会返回No broken requirements found.

5.1 更改默认源

在安装三方库的时候,为了用清华源来加快安装一般会在安装语句后面添加-i https://pypi.tuna.tsinghua.edu.cn/simple,但是每次安装后面都加这么一句会使得操作很繁琐。可以通过以下设置对pip进行整体换源:

  1. 在找到pip初始化文件pip.ini,一般默认在C:\用户\AppData\Roaming\pip在这里插入图片描述

  2. 右键pip.ini,打开方式,记事本,粘贴以下内容并保存:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
  1. 验证pip源设置:在命令行输入
pip config get global.index-url

在这里插入图片描述

返回清华源网址即代表修改成功,之后安装第三方库无需每次手动设置源

Logo

欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。

更多推荐