盘天下 | 免费精选资源分享

用 Python 写网络爬虫(第2版)

出版刊物 2024-12-12 916 0


作者简介

Katharine Jarmul 是 德国 柏林的一位 数据 科学 家和 Python 支持者。她 经营 了一家数据科学咨询公司——Kjamistan,为不同规模的 企业 提供诸如数据抽取、采集以及建模的服务。她从 2008 年开始使用 Python 进行 编程 ,从 2010 年开始使用 Python 抓取网站,并且在使用 网络 爬虫 进行 数据分析 和机器 学习 的不同规模的初创企业中 工作 过。读者可以通过 Twitter(@kjam)关注她的想法以及动态。
Richard Lawson 来自澳大利亚,毕业于墨尔本大学 计算机 科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过 50 个国家的业务提供远程工作。他精通 世界 语,可以使用汉语和 韩语 对话,并且积极投身于开源 软件 事业。他目前正在牛津大学攻读研究生学位,并利用业余 时间 研发自主无人机。
译者介绍
李斌,毕业于 北京 科技 大学 计算机科学与技术 专业,获得硕士学位。曾任职于 阿里巴巴 ,当前供职于凡普金科,负责应用 安全 工作。热爱 Python 编程和 Web 安全,希望以更加 智能 和自动化的方式 提升 网络安全 。博客地址为 python er.com。

用 Python 写网络爬虫(第2版)

内容简介

《用 Python 写网络爬虫(第2版)》包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。

Katharine Jarmul 是德国柏林的一位数据科学家和 Python 支持者。她经营了一家数据科学咨询公司——Kjamistan,为不同规模的企业提供诸如数据抽取、采集以及建模的服务。她从 2008 年开始使用 Python 进行编程,从 2010 年开始使用 Python 抓取网站,并且在使用网络爬虫进行数据分析和 机器学习 的不同规模的初创企业中工作过。读者可以通过 Twitter(@kjam)关注她的想法以及动态。

Richard Lawson 来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过 50 个国家的业务提供远程工作。他精通世界语,可以使用汉语和韩语对话,并且积极投身于 开源软件 事业。他目前正在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。

译者介绍

李斌,毕业于北京科技大学计算机...

下载地址

闲趣赚

转载请注明出处,本文链接:https://www.80srz.com/pantx/47056.html

(0)
收藏 (0)

评论列表