分布式爬虫从零开始 拖更了这么久。。终于回来了,明天更新,会重新整理目录结构,这段时间也是,想了很多东西,坚决不能烂尾 在拟定计划中。。。。。。一定会做好。 在学习之前请务必掌握一些python基础知识,之后我们就可以开始了! 项目预估时间20天左右,平均两天更新一章内容,敬请期待........ 欢迎在issues中留言,如果文章中有错别字可以向我提pr,感谢各位! 目录 引言 01 - 爬虫预备知识 02 - 请求分析流程 03 - requests模块的使用 04 - 数据提取概念和数据的分类 05 - JSON数据提取 06 - re 正则表达式提取数据 实例目录 01 - 豆瓣热门爬虫-入门 02 - 百度贴吧爬虫-入门 03 - 百度翻译爬虫-逆向 文献整理 http知识 维基百科 百度百科 来自简书 Chrome控制台 官方教程 来自知乎 Requests使用 官方中文文档 JSON 菜鸟教程 XML 菜鸟教程