用 Python 写网络爬虫(第2版)

豆瓣
用 Python 写网络爬虫(第2版)

登入後可管理標記收藏

ISBN: 9787115479679
作者: [德] 凯瑟琳·雅姆尔(Katharine·Jarmul) / [澳] 理查德·劳森(Richard·Lawson)
譯者: 李斌
出版社: 人民邮电出版社
發行時間: 2018 -7
裝訂: 平装
價格: 49.00 元
頁數: 200

/ 10

0 個評分

評分人數不足
借閱或購買

Python Web Scraping - Second Edition

[德] 凯瑟琳·雅姆尔(Katharine·Jarmul) / [澳] 理查德·劳森(Richard·Lawson)    譯者: 李斌

簡介

本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。

contents

前言
资源与支持
第1章 网络爬虫简介
第2章 数据抓取
第3章 下载缓存
第4章 并发下载
第5章 动态内容
第6章 表单交互
第7章 验证码处理
第8章 Scrapy
第9章 综合应用

其它版本
短評
評論
笔记