scrapy的简单使用
scrapy
windos下scrapy框架的安装
1 | 1.pip install wheel |
scrapy的简单使用
1 | 1.创建一个工程 scrapy startproject 项目名称 |
scrapy框架的基本架构
1 | 五大组件: |
scrapy目录
1 | firstscrapy #项目名字 |
使用文件执行运行命令
1 | 现在我们每次执行爬虫程序都需要使用命令,较为麻烦,我们可以新建一个py文件,然后在文件内写上对应的命令,下次直接执行文件即可。 |
scrapy中response的基本方法
1 | 1.text #获得爬取页面的页面数据 |
scrapy提供的解析方法
1 | #xpath |
xpath取数据
1 | #取文本 |
css选择器取数据
1 | #取文本 |
scrapy解析出新地址后继续爬取
1 | 在解析的函数最后添加一个yield |
scrapy参数的配置
1 | 1.是否遵循爬虫协议 |