基本信息
- 出版社 : 机械工业出版社; 第1版 (2017年9月20日)
- 出版日期 : 2017年9月1日
- 品牌 : 北京华章图文信息有限公司
- 语言 : 简体中文
- 文件大小 : 145490 KB
- 纸书页数 : 641页
- 尼克·麦克卢尔(Nick McClure) (作者), 曾益强 (译者)
- 下载格式:azw3、epub、mobi
编辑推荐
资深数据科学家撰写,从实战角度系统讲解TensorFlow基本概念及各种应用实践。真实的应用场景和数据,丰富的代码实例,详尽的操作步骤,为你深
度实践TensorFlow提供翔实指导。
内容简介
本书由资深数据科学家撰写,从实战角度系统讲解TensorFlow基本概念及各种应用实践。真实的应用场景和数据,丰富的代码实例,详尽的操作步骤,带你由浅入深系统掌握TensorFlow机器学习算法及其实现。
全书共11章,*1章介绍TensorFlow的基本概念;*2章介绍如何在计算图中连接算法组件,创建一个简单的分类器;*3章重点介绍如何使用TensorFlow实现各种线性回归算法;*4章介绍支持向量机(SVM)算法;*5章介绍如何使用数值度量、文本度量和归一化距离函数实现最近邻域算法;*6章讲述如何使用TensorFlow实现神经网络算法;*7章阐述TensorFlow实现的各种文本处理算法。*8章扩展神经网络算法;*9,解释在TensorFlow中如何实现递归神经网络(RNN)算法;*10章介绍TensorFlow产品级用例和tips;*11章展示TensorFlow如何实现k-means算法、遗传算法和解决常微分方程(ODE)等。
作者简介
Nick McClure 资深数据科学家,目前就职于美国西雅图PayScale公司。曾经在凯撒娱乐集团工作。他在蒙大拿大学和圣本尼迪克与圣约翰大学学院的应用数学专业获得学位。他热衷于数据分析、机器学习和人工智能。Nick有时会把想法写成博客(//fromdata.org/)或者推特(@nfmcclure)。
前言
前言
2015年11月,Google公司开源TensorFlow,随后不久TensorFlow成为GitHub上最受欢迎的机器学习库。TensorFlow创建计算图、自动求导和定制化的方式使得其能够很好地解决许多不同的机器学习问题。
本书介绍了许多机器学习算法,将其应用到真实场景和数据中,并解释产生的结果。
本书的主要内容
*1章介绍TensorFlow的基本概念,包括张量、变量和占位符;同时展示了在TensorFlow中如何使用矩阵和各种数学操作。本章末尾讲述如何访问本书所需的数据源。
*2章介绍如何在计算图中连接*1章中的所有算法组件,创建一个简单的分类器。接着,介绍计算图、损失函数、反向传播和训练模型。
*3章重点讨论使用TensorFlow实现各种线性回归算法,比如,戴明回归、lasso回归、岭回归、弹性网络回归和逻辑回归,也展示了如何在TensorFlow计算图中实现每种回归算法。
*4章介绍支持向量机(SVM)算法,展示如何在TensorFlow中实现线性SVM算法、非线性SVM算法和多分类SVM算法。
*5章展示如何使用数值度量、文本度量和归一化距离函数实现最近邻域法。我们使用最近邻域法进行地址间的记录匹配和MNIST数据库中手写数字的分类。
*6章讲述如何使用TensorFlow实现神经网络算法,包括操作门和激励函数的概念。随后展示一个简单的神经网络并讨论如何建立不同类型的神经网络层。本章末尾通过神经网络算法教TensorFlow玩井字棋游戏。
*7章阐述借助TensorFlow实现的各种文本处理算法。我们展示如何实现文本的“词袋”和TF-IDF算法。然后介绍CBOW和skip-gram模型的神经网络文本表示方式,并对于Word2Vec和Doc2Vec用这些方法来做预测。
*8章扩展神经网络算法,说明如何借助卷积神经网络(CNN)算法在图像上应用神经网络算法。我们展示如何构建一个简单的CNN进行MNIST数字识别,并扩展到CIFAR-10任务中的彩色图片,也阐述了如何针对自定义任务扩展之前训练的图像识别模型。本章末尾详细解释TensorFlow实现的模仿大师绘画和Deep-Dream算法。
*9章解释在TensorFlow中如何实现递归神经网络(RNN)算法,展示如何进行垃圾短信预测和在莎士比亚文本样本集上扩展RNN模型生成文本。接着训练Seq2Seq模型实现德语-英语的翻译。本章末尾展示如何用孪生RNN模型进行地址记录匹配。
*10章介绍TensorFlow产品级用例和开发提示,同时介绍如何利用多处理设备(比如,GPU)和在多个设备上实现分布式TensorFlow。
*11章展示TensorFlow如何实现k-means算法、遗传算法和求解常微分方程(ODE),还介绍了Tensorboad的各种用法和如何查看计算图指标。
阅读本书前的准备
书中的章节都会使用TensorFlow,其官网为https://www.tensorflow.org/,它是基于Python 3(https://www.python.org/downloads/)编写的。大部分章节需要访问从网络中下载的数据集。
本书的目标读者
本书适用于有经验的机器学习读者和Python程序员。有机器学习背景的读者会发现TensorFlow的代码很有启发性;有Python编程经验的读者会觉得代码注释极具参考性。
模块说明
在本书中,你会频繁看到开始、动手做、工作原理、延伸学习和参考这几个模块。
为了系统地学习相关技术,下面简单解释一下:
·开始
该节告诉读者该技术的内容,描述如何准备软件或者前期的准备工作。
动手做
具体的操作步骤。
·工作原理
详细解释前一节发生了什么。
·延伸学习
附加资源,以供读者延伸学习。
·参考
提供有用的链接和有帮助的资源信息。
下载示例代码
读者可登录华章网站(www.hzbook.com)下载本书示例代码文件。
精彩书摘
本章将介绍TensorFlow的基本概念,帮助读者去理解TensorFlow是如何工作的,以及它如何访问数据集和学习资源。学完本章可以掌握以下知识点:
·TensorFlow如何工作
·声明变量和张量
·占位符和变量的用法
·矩阵的使用
·声明计算操作
·实现激励函数
·读取数据源
·学习资料
Google的TensorFlow引擎提供了一种解决机器学习问题的高效方法。机器学习在各行各业应用广泛,特别是计算机视觉、语音识别、语言翻译和健康医疗等领域。本书将详细介绍TensorFlow操作的基本步骤以及代码。这些基础知识对理解本书后续章节非常有用。
首先,TensorFlow的计算看起来并不是很复杂,因为TensorFlow的计算过程和算法开发相当容易。这章将引导读者理解TensorFlow算法的伪代码。
截至目前,TensorFlow支持Linux、Mac和Windows操作系统。本书的代码都是在Linux操作系统上实现和运行的,不过运行在其他操作系统上也没问题。本书的代码可以在GitHub(https://github.com/nfmcclure/tensorflow_cookbookTensorFlow)上获取。虽然TensorFlow是用C++编写,但是全书只介绍TensorFlow的Python使用方式。本书将使用Python 3.4+(https://www.python.org)和TensorFlow 0.12(https://www.tensorflow.org)。TensorFlow官方已经在GitHub上发布1.0.0 alpha版本,本书代码兼容相应版本。TensorFlow能在CPU上运行,大部分算法在GPU上会运行得更快,它支持英伟达显卡(Nvidia Compute Capability v4.0+,推荐v5.1)。TensorFlow上常用的GPU是英伟达特斯拉(Nvidia Tesla)和英伟达帕斯卡(Nvidia Pascal),至少需要4GB的RAM。为了运行GPU,需要下载Nvidia Cuda Toolkit及其v5.x版本(https://developer.nvidia.com/cuda-downloads)。本书还依赖Python的包:Scipy、Numpy和Scikit-Learn。