主编推荐语
这本书告诉你,如何使用Python来编写网络爬虫程序。
内容简介
书中主要内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,帮助你活学活用书中介绍的技术。 本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。
出版方
人民邮电出版社
这本书告诉你,如何使用Python来编写网络爬虫程序。
书中主要内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,帮助你活学活用书中介绍的技术。 本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。
人民邮电出版社