import this.
- 前言
- 学习Python,基本语法,常用数据处理库
- 你是如何自学 Python 的? - 知乎
- Python 2.7教程 - 廖雪峰,学基础看这个完全就够了。
- 或者看他讲的视频,Python入门 - 廖雪峰。
- 了解网页的基本结构、组成 HTML+CSS+JS三剑客
- 类比于一个人,HTML就是骨架、CSS是衣服、JS是这个人的一系列动作,比如打自己一巴掌。
- HTML 教程,CSS 教程,JavaScript 教程
- 了解爬虫工作原理,涉及文件下载,数据解析,以及数据存储
- 如何入门 Python 爬虫? - 知乎
- 网页下载,HTTP协议详解,一个非常好用的Python库,Requests for Humans
- 数据解析,深入浅出之正则表达式(一),regex可视化工具
- 超越正则表达式,XPath是什么鬼。
- 数据存储,Python自带轻量级数据库SQLite。
- 了解各种坑,模拟登陆,JS加载、点击动作,请求次数限制
- 超级武器,上手Scrapy框架
- 非常好用的大而全功能完备的Scrapy框架
- 这里有之前版本的中文翻译,Scrapy 0.25 文档。
- 一栈式解决方案,直接上浏览器webkit解决JS动态加载问题
- 究极武器,直接使用第三方服务:PQL,Kimono