用微信扫描二维码

精通Python爬虫框架Scrapy

精通Python爬虫框架Scrapy

作者:[美]迪米特里奥斯 考奇斯-劳卡斯

2018.2.1 出版

可语音朗读

开通电子书VIP
35.00得到贝

主编推荐语

在学习完本书后,你将对数据爬取胸有成竹,并将数据应用在自己的应用程序中。

内容简介

Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架,用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。 本书共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。

出版方

人民邮电出版社