创建main.py
from scrapy.cmdline import execute
import sys
import os
# print(os.path.dirname(os.path.abspath(__file__)))
# F:\ScrapyProjects\qiantuSpider\qiantuSpider
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy", "crawl", "qtspider"])
右键, debug main.py执行
- Scrapy Engine 引擎
- Scheduler 调度器
- Downloader 下载器
- Spider 爬虫
- Item Pipeline 管道
- Downloader MiddleWares 下载中间件
- Spider MiddleWares Sipder中间件
- 新建项目 (scrapy startproject xxx): 新建一个新的爬虫项目
- 明确目标 (编写items.py, pipelines.py和setting.py): 明确你想要抓取的目标和进一步处理数据
- 制作爬虫 (spiders/xxspider.py): 制作爬虫开始爬取网站
- 存储内容 (pipeline.py): 设计管道存储爬取内容
v1. 1.制作福田表格 2.单链接爬取
v2. 1.多连接一起爬取 2.自动切换表格导入