基本信息

  • 出版社 : 机械工业出版社; 第1版 (2019年12月12日)
  • 出版日期 : 2020年1月1日
  • 品牌 : 北京华章图文信息有限公司
  • 语言 : 简体中文
  • 文件大小 : 18617 KB
  • 纸书页数 : 454页
  • 董洪义 (作者)
  • 下载格式:azw3、epub、mobi 

内容简介

  本书从概念、发展、经典实现方法等几个方面系统地介绍了物体检测的相关知识,重点介绍了Faster RCNN、SDD和YOLO这三个经典的检测器,并利用PyTorch框架从代码角度进行了细致讲解。另外,本书进一步介绍了物体检测的轻量化网络、细节处理、难点问题及未来的发展趋势,从实战角度给出了多种优秀的解决方法,便于读者更深入地掌握物体检测技术,从而做到在实际项目中灵活应用。

前言

  随着深度学习的飞速发展,计算机视觉技术取得了令人瞩目的成果,尤其是物体检测这一基础又核心的分支,诞生了众多经典算法,在自动驾驶、智能医疗、智能安防及搜索娱乐等多个领域都得到了广泛应用。与此同时,诞生于2017年的PyTorch框架,凭借其简洁优雅、灵活易上手等优点,给开发人员留下了深刻的印象。
  目前,国内图书市场上已经出版了几本PyTorch方面的图书,但大多数图书停留在浅层的概念与简单示例的讲解上,缺乏实用性,而且也没有一本系统讲解PyTorch物体检测方面的图书。因此,图书市场上迫切需要一本系统介绍PyTorch物体检测技术的书籍。这便是笔者写作本书的初衷。
  本书是国内原创图书市场上首部系统介绍物体检测技术的图书。书中利用PyTorch深度学习框架,从代码层面讲解了Faster RCNN、SSD及YOLO这三大经典框架的相关知识,并进一步介绍了物体检测的细节与难点问题,让读者可以全面、深入、透彻地理解物体检测的种种细节,并能真正提升实战能力,从而将这些技术灵活地应用到实际开发中,享受深度学习带来的快乐。
  本书特色
  1.系统介绍了PyTorch物体检测技术
  本书深入物体检测这一基础又核心的技术,从其诞生背景、主流算法、难点问题、发展趋势等多个角度详细介绍了物体检测知识,并结合代码给出了多个算法的实现。
  2.从代码角度详细介绍了物体检测的三大算法
  本书介绍了Faster RCNN、SSD及YOLO这三个影响深远的检测算法,从代码层面详细介绍了它们所实现的每一个细节与难点,并进行了优缺点分析,而且给出了多种优化算法。
  3.涵盖所有主流的物体检测算法
  本书几乎涵盖所有主流的物体检测算法,包括VGGNet、ResNet、FPN、DenseNet和DetNet等卷积基础网络,以及从Faster RCNN、HyperNet、Mask RCNN、SSD、RefineDet、YOLO v1到YOLO v3、RetinaNet、CornerNet和CenterNet等物体检测算法,呈现给读者一个完整的知识体系。
  4.给出了多个实际的物体检测实例,有很强的实用性
  本书对PyTorch的知识体系进行了较为精炼的介绍,还结合物体检测算法重点介绍了PyTorch实现的多个物体检测实例。因此本书不仅是一本很好的PyTorch框架学习书籍,更是一本PyTorch物体检测实战宝典。
  5.对物体检测技术常见的细节、难点及发展做了详细分析
  本书不仅对物体检测技术的热门话题做了详细分析,例如非极大值抑制、样本不均衡、模型过拟合、多尺度检测、物体拥挤与遮挡等,而且对各种细节与常见问题做了详细分析,并给出了多种解决方法。
  本书内容
  第1篇 物体检测基础知识
  本篇涵盖第1~3章,介绍了物体检测技术与PyTorch框架的背景知识与必备的基础知识。主要内容包括物体检测技术的背景与发展;物体检测的多种有效工具;PyTorch背景知识与基础知识;多种基础卷积神经网络的相关知识与具体实现等。掌握本篇内容,可以为读者进一步学习物体检测技术奠定基础。
  第2篇 物体检测经典框架
  本篇涵盖第4~6章,介绍了Faster RCNN、SSD与YOLO三大经典算法的思想与实现。主要内容包括Faster RCNN两阶算法的思想;锚框Anchor的意义与实现;Faster RCNN的多种改进算法;SSD单阶算法的思想与实现;SSD的数据增强方法及多种改进算法;YOLO单阶算法的三个版本演变过程及具体实现等。掌握本篇内容,可以让读者从代码角度学习物体检测的种种细节。
  第3篇 物体检测的难点与发展
  本篇涵盖第7~10章,介绍了物体检测技术的细节、难点及未来发展。主要内容包括针对模型加速的多种轻量化网络思想与实现;非极大值抑制;样本不均衡及模型过拟合等物体检测细节问题的背景知识与解决方法;多尺度、拥挤与遮挡等物体检测难点问题的背景知识与解决方法;多种摆脱锚框的检测算法;物体检测的未来发展趋势等。掌握本篇内容,可以让读者更加深入地学习物体检测的相关技术。
  本书读者对象
  ·需要全面学习物体检测技术的人员;
  ·PyTorch框架爱好者和研究者;
  ·计算机视觉从业人员与研究者;
  ·深度学习从业人员与爱好者;
  ·自动驾驶、智能安防等领域的开发人员;
  ·人工智能相关产业的从业人员;
  ·计算机、机器人等专业的高校学生。
  阅读建议
  ·没有物体检测与PyTorch基础的读者,建议从第1章顺次阅读并演练每一个实例。
  ·有一定PyTorch与物体检测基础的读者,可以根据实际情况有重点地选择阅读各个算法的细节。
  ·对于每一个检测算法,建议读者先阅读一下原论文,多思考算法设计的动机与目的,并重点思考如何用代码实现,这会加深读者对检测算法的理解。原论文的下载地址和本书源代码文件一起提供。
  ·多思考各种物体检测算法的优缺点、相互之间的联系与区别,以及可以优化和改进的细节等,形成完整的知识体系树,这样会进一步加深读者对知识的理解。
  配书资源获取方式
  本书涉及的全部源代码都放在了GitHub上,需要读者自行下载。下载地址如下:
  https://github.com/dongdonghy/Detection-PyTorch-Notebook
  有些章节的代码较多,但在书中仅给出了重要的片段代码,完整代码以GitHub上的代码为准。
  另外,读者也可以登录华章公司的网站www.hzbook.com,搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到相关的下载链接。
  致谢
  本书的编写得到了许多人的帮助。可以说,本书是多人共同努力的结晶。感谢北京源智天下科技有限公司的王蕾,她在稿件整理方面帮我做了大量的工作!感谢王田苗教授、陶吉博士、夏添博士、侯涛刚博士、严德培、单增光、王策、鄂俊光、李成、丁宁、付航、高鹏、朱本金、彭强、王粟瑶、张腾、王兆玮、黄彬效和拓万琛等人,他们对本书提出了许多宝贵的意见和建议!感谢我的女朋友及家人,他们一直以来都对我鼓励有加,给我写作本书以最大的动力!感谢为本书付出辛勤工作的每一位编辑,他们认真、细致的工作让本书质量提高不少!
  由于本书涉及的知识点较多,难免有错漏与不当之处,敬请各位读者指正。如有疑问,请随时通过电子邮件与笔者联系,笔者将不胜感激。联系邮箱:hzbook2017@163.com。
  董洪义

精彩书摘

  视觉是人类最为重要的感知系统,大脑皮层中近一半的神经元与视觉有关系。计算机视觉则是研究如何使机器学会“看”的学科,最早起源于20世纪50年代,当时主要专注于光学字符识别、航空图片的分析等特定任务。在20世纪90年代,计算机视觉在多视几何、三维重建、相机标定等多个领域取得了众多成果,也走向了繁荣发展的阶段。
  然而在很长的一段时间里,计算机视觉的发展都是基于规则与人工设定的模板,很难有鲁棒的高语义理解。真正将计算机视觉的发展推向高峰的,当属深度学习的爆发。由于视觉图像丰富的语义性与图像的结构性,计算机视觉也是当前人工智能发展最为迅速的领域之一。
  进入深度学习发展阶段后,计算机视觉在多个领域都取得了令人瞩目的成就,如图1.7所示。
  ·图像成像:成像是计算机视觉较为底层的技术,深度学习在此发挥的空间更多的是成像后的应用,如修复图像的DCGAN网络,图像风格迁移的CycleGAN,这些任务中GAN有着广阔的发挥空间。此外,在医学成像、卫星成像等领域中,超分辨率也至关重要,例如SRCNN(Super-Resolution CNN)。
  ·2.5D空间:我们通常将涉及2D运动或者视差的任务定义为2.5D空间问题,因为其任务跳出了单纯的2D图像,但又缺乏3D空间的信息。这里包含的任务有光流的估计、单目的深度估计及双目的深度估计。
  ·3D空间:3D空间的任务通常应用于机器人或者自动驾驶领域,将2D图像检测与3D空间进行结合。这其中,主要任务有相机标定(Camera Calibration)、视觉里程计(Visual Odometry,VO)及SLAM(Simultaneous Localization and Mapping)等。
  ·环境理解:环境的高语义理解是深度学习在计算机视觉中的主战场,相比传统算法其优势更为明显。主要任务有图像分类(Classification)、物体检测(Object Detection)、图像分割(Segmentation)、物体跟踪(Tracking)及关键点检测。其中,图像分割又可以细分为语义分割(Semantic Segmentation)与实例分割(Instance Segmentation)。


资源下载付费资源价格2立即支付
支付后请复制提取码进入网盘下载,电子书格式请参考“基本信息”说明, 如未显示下载按钮,请刷新网页或扫码关注公众号联系客服处理。