基本信息

  • 出版社 : 机械工业出版社; 第1版 (2018年2月28日)
  • 出版日期 : 2017年3月1日
  • 品牌 : 北京华章图文信息有限公司
  • 语言 : 简体中文
  • 文件大小 : 22357 KB
  • 纸书页数 : 423页
  • 范传辉 (作者)
  • 下载格式:azw3、epub、mobi 

编辑推荐


  零基础学习爬虫技术,从Python和Web前端基础开始讲起,由浅入深,包含大量案例,实用性强。
  从静态网站到动态网站,从单机爬虫到分布式爬虫,涵盖Scrapy和PySpider框架的运用、去重方案的设计和分布式爬虫的搭建等。
  这是一本实战性很强的书,书中共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,包含从入门到进阶的所有知识。读者认真学习完本书之后不再是个菜鸟,可以自主地开发Python爬虫项目。

内容简介

  随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍Pthyon编程语言和Web前端基础知识引领读者入门,之后介绍动态爬虫原理以及Scrapy爬虫框架,最后介绍大规模数据下分布式爬虫的设计以及PySpider爬虫框架等。
  主要特点:
  由浅入深,从Python和Web前端基础开始讲起,逐步加深难度,层层递进。
  内容详实,从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,方便读者完成进阶。
  实用性强,本书共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。
  难点详析,对js加密的分析、反爬虫措施的突破、去重方案的设计、分布式爬虫的开发进行了细致的讲解。

作者简介

  范传辉,资深网虫,Python开发者,参与开发了多项网络应用,在实际开发中积累了丰富的实战经验,并善于总结,贡献了多篇技术文章广受好评。研究兴趣是网络安全、爬虫技术、数据分析、驱动开发等技术。


资源下载付费资源价格2立即支付
支付后请复制提取码进入网盘下载,电子书格式请参考“基本信息”说明, 如未显示下载按钮,请刷新网页或扫码关注公众号联系客服处理。