GitHub - 54fire/BuildSpider · GitHub
Skip to content

54fire/BuildSpider

Folders and files

Repository files navigation

@Author: 54fire
@Date: 2019-08-01
@Version: v1.0.0

文件结构

  • build_spider - 文件目录
    • core - 主要爬虫文件位置
      • building_spider
        • building_spider.py
        • project_spider.py
        • filter_project.py
        • detail_spider.py
        • save.py
      • db
        • redis.py
    • config - 主要用来提供公司名,以及代理 ip
      • proxy
      • post_proxy
      • result
    • temp - 用来存放的临时文件, 方便排查错误
      • yes.txt
      • no.txt
    • utils - 为 requests 请求提供 headers
      • http.py
    • domain.py
    • settint.py
    • main.py - 程序入口

【Use】

  1. 将可用的 ip 保存到proxypost_proxy文件中, 且每一个之间站位一行, 格式为 ip:port 例如:123.23.34.42:2048.

  2. 修改setting.py中的配置文件,对爬虫需要的信息进行筛选

  3. 运行main.py文件

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

Languages