Python 3反爬虫原理与绕过实战

Python 3反爬虫原理与绕过实战

作者
韦世东
语言
中文
出版社
人民邮电出版社
ISBN
9787115528735
页数
377
格式
pdf

编辑推荐

适读人群 :本书既适合需要储备反爬虫知识的前端工程师和后端工程师阅读,也适合需要储备绕过知识的爬虫工程师、爬虫爱好者以及Python程序员阅读。
【人气推荐】《Python 3 网络爬虫开发实战》作者、微软小冰工程师崔庆才作序,腾讯、马蜂窝工程师倾力推荐。

【干货满满】爬虫工程师不可错过的“****”,内容包括但不限于Cookie 反爬虫、WebSocket 反爬虫、字体反爬虫、WebDriver反爬虫、App 反爬虫、验证码反爬虫。

【反爬虫原理+爬虫实战】从实战出发,印证国内互联网企业内部加密原理,侧重讲解反爬虫的原理以及绕过方法。

【21个反爬虫示例】结合练习平台 Steamboat,帮助读者随时复现书中的 21个爬虫示例,巩固所学知识。

内容简介

本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响,紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过,然后概览了App数据爬取的关键和常用的反爬虫手段,最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。

作者简介

韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。

精彩书评

  本书内容十分详尽,几乎涵盖了市面上所有的反爬虫类型,包括但不限于 Cookie 反爬虫、WebSocket 反爬虫、字体反爬虫、WebDriver 反爬虫、App 反爬虫、验证码反爬虫。书中首先对各类反爬虫技术进行了合理的归类,然后通过剖析多个案例帮助大家理解各类反爬虫技术的原理。另外,书中还针对各类反爬虫给出了对应的绕过和破解方案。这本书干货满满,可以帮助大家全面了解爬虫和反爬虫的各类技术,强烈推荐给大家。
—— 崔庆才
微软小冰工程师
《Python 3 网络爬虫开发实战》作者

在大数据时代,所有公司都离不开数据,而获取数据非常快的方式就是利用爬虫去爬取。随着爬虫的增多,反爬虫水平也在不断提高。本书作者自己搭建了 21 个示例,深入解析了 CSS 偏移、字体反爬虫、JavaScript 混淆、App 逆向、验证码破解和加密算法等知识,并用详细的代码手把手教你如何实现反爬虫以及如何破解反爬虫,让大家真正做到“知其然,知其所以然”。强烈推荐给每一位想要从事爬虫工作,以及希望提高爬虫技术水平的朋友们。
—— 陈祥安
马蜂窝高级工程师

我见证了作者从一个零基础小白逐渐成长为一名出色的爬虫工程师的过程。相信本书不仅是技术满满的干货集,也是他记录成长历程的诚意之作!
—— BruceDone
腾讯后端开发工程师

相关文件下载地址

该资源需登录后下载

去登录
温馨提示:本站所有内容及下载按钮仅作站点演示用,并不提供真实下载链接。

评分及评论

4

(满分5, 共1用户评价)

来评个分数吧

  • 5 分
    0
  • 4 分
    1
  • 3 分
    0
  • 2 分
    0
  • 1 分
    0

Comments