已经是八月份了,暑假已经过了一半的说
【20190401】很感谢能点进来看的你们,唯独这篇文章让我这个小站有了每天的固定个位数访客,为表达对老铁们的感谢特更新了文章,详情请见:Win-10 安装 TensorFlow-GPU 1.13.1(Python 3.7.2 + CUDA 10.0 + cuDNN 7.5.0 + TensorRT 5.0.4.3)
0x00.缘由
Q:为什么要写(这么低级的)配置教程?
A:(其实并不低级;网上的是旧的;一看编译就头疼),鉴于以后(或许)会有多篇关于TensorFlow
的文章(花式挖坑),所以在这里有必要介绍一下其安装方法
Q:TensorFlow
是什么?
A:TensorFlow is an Open Source Software Library for Machine Intelligence
由
Tensor
(张量)上的函数自动求导。Tensor
意味着N
维数组,Flow
(流)意味着基于数据流图的计算,TensorFlow
即为张量从图的一端流动到另一端。
它的一大亮点是支持异构设备分布式计算,它能够在各个平台上自动运行模型,从电话、单个CPU/GPU
到成百上千GPU
卡组成的分布式系统。
支持CNN、RNN和LSTM
算法,是目前在Image、NLP
最流行的深度神经网络模型。
Q:为什么要研究这个?
A:
深度学习通常意味着建立具有很多层的大规模的神经网络。
除了输入X
,函数还使用一系列参数,其中包括标量值、向量以及最昂贵的矩阵和高阶张量。
在训练网络之前,需要定义一个代价函数,常见的代价函数包括回归问题的方差以及分类时候的交叉熵。
训练时,需要连续的将多批新输入投入网络,对所有的参数求导后,代入代价函数,从而更新整个网络模型。
这个过程中有两个主要的问题:1. 较大的数字或者张量在一起相乘百万次的处理,使得整个模型代价非常大。2. 手动求导耗时非常久。
所以TensorFlow
的对函数自动求导以及分布式计算,可以帮我们节省很多时间来训练模型。
Q:它有什么优点?
A:
1.基于
python
,写的很快并且具有可读性;
2.在多GPU
系统上的运行更为顺畅;
3.代码编译效率较高;
4.社区发展的非常迅速并且活跃;
5.能够生成显示网络拓扑结构和性能的可视化图。
0x01.环境
a. Microsoft Windows [版本 10.0.15063](Win 10 x64 Pro 1703 15063.483)
b. Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32
c. JetBrains Pycharm 2017.2 x64 Professional
d. GeForce GTX 965M
0x02.安装
1.安装python 36
一路下一步打钩环境变量设置即可。不建议python 27
,因为好像不支持,所以最后一步会报Could not find a version that satisfies the requirement tensorflow-gpu (from versions: ) No matching distribution found for tensorflow-gpu
2.更换清华pip
镜像源
默认源服务器在国外,国内下载较慢,有必要换为国内清华源。
临时使用
1 | pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package |
注意,simple
不能少, 是https
而不是http
设为默认
升级pip
到最新的版本(>=10.0.0)
后进行配置:
1 | Microsoft Windows [版本 10.0.17763.652] |
pip.ini
文件配置示例如下:
1 | [global] |
2019-8-24 13:31:12
:这里吐槽下科大其实用的是清华的源……已改为清华源
3.升级pip
py -2 -m pip install --upgrade pip
由于我电脑安装了两个版本,所以用 py -2 选择 2 版本的解释器,同理 py -3 即是选择 3 版本的解释器
TensorFlow
有两个版本:CPU
版本和GPU
版本。
如果你的电脑没有NVIDIA
显卡的话,你就必须选择安装这个版本,不过这个版本的安装要比GPU
版的简单,官方也推荐先用CPU
版的来体验。TensorFlow
在GPU
上运行要比CPU
上快很多,如果你的GPU
能够达到要求就可以选择安装GPU
版。GPU
版本需要CUDA
和cuDNN
的支持,要安装GPU
版本,需确认显卡是否支持CUDA
,查看GPU是否支持CUDA,计算能力大于3.5
的N
卡一般都支持的说……
另,网上多建议安装Anaconda
,因为这个集成了很多科学计算所必需的库,能够避免很多依赖问题,这个Pycharm
党就先不安了(其实我安了但是可能是因为我用习惯了感觉没有Pycharm
舒服)
4.安装CUDA
Windows
→x86_64
→10
→exe (local)
下载如下两个文件,按照先后顺序安装:Base Installer Download (1.3 GB)
Patch 2 (Released Jun 26, 2017) Download (43.1 MB)
安装完之后,在命令行输入nvcc -V
,会有正常回显……
5.安装cuDNN
cuDNN
可以在前面GPU
加速基础上大概再提升1.5
倍的速度,同样由nVIDIA
开发。官网注册账号,下载cuDNN v8.0 Library for Windows 10
压缩包,解压完将对应文件夹(bin、include、lib
)覆盖至CUDA
的安装目录,即C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
,然后把C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
加入环境变量,并将bin
文件夹里的cudnn64_6.dll
重命名为cudnn64_5.dll
(此处参考tensorflow/issues/7705,其实换旧版本也可以解决stackoverflow,因为重下安装包较大故采用前一方法),才算完成。
话说注册账号要求好麻烦,大小写包含特殊符号且不少于6位……
6.pip
安装TensorFlow-GPU
(最后一步)
pip3 install --upgrade tensorflow-gpu
万一在线pip
安装失败了,就离线安装,到http://www.lfd.uci.edu/~gohlke/pythonlibs/下载python
的whl
包tensorflow_gpu‑1.1.0‑cp36‑cp36m‑win_amd64.whl
,然后命令提示符运行pip install < 此处填写 .whl 所在位置 >
(可以将.whl
文件拖入命令提示符中即生成其位置)
0x03.测试
1 | #! python3 |
我的输出较长:
1 | C:\Python36\python.exe C:/Users/yuangezhizao/PycharmProjects/deeplearning/helloworld.py |
这里之所以会出红字提示是因为没有在本机编译,尝试编译(实在是不会……),于是重启进Mac
里……未完待续
0x04.引用
TensorFlow 入门
windows 10 64bit下安装Tensorflow+Keras+VS2015+CUDA8.0 GPU加速
【TensorFlow】Windows10 64 位下安装 TensorFlow - 官方原生支持
【TensorFlow】Windows环境下PyCharm运行TensorFlow GPU版(附TensorFlow更新方法)
windows 10 64bit下安装Tensorflow+Keras+VS2015+CUDA8.0 GPU加速