Pycharm+Scrapy安装并且初始化项目的方法
作者:方naoke 时间:2023-03-05 11:49:00
前言
Scrapy是一个开源的网络爬虫框架,Python编写的。最初设计用于网页抓取,也可以用来提取数据使用API或作为一个通用的网络爬虫。是数据采集不可必备的利器。
安装
pip install scrapy
如果使用上面的命令太慢。国内可以使用豆瓣源进行加速。
pip install -i https://pypi.douban.com/simple scrapy
注意要写错了,是 https://pypi.douban.com/simple 很多包都可以使用这个源进行加速,这也是pip的一个技巧,还可以使用阿里云进行加速。
安装完成之后在命令行输入
scrapy -v
如果出现了相应的版本号就说明安装成功。
创建项目
目前还没有IDE 能够创建scrapy的项目,我们必须手动初始化项目。
1、找一个目录
输入命令
scrapy startproject SpiderObject
命令行出现这样的结果说明创建成果
You can start your first spider with:
cd SpiderObject
scrapy genspider example example.com
去文件夹中看看
初始化项目
使用pycharm打开该项目
如果出现这个页面就说明对了。
下面生成一个模板
打开pycharm的terminal
输入
scrapy genspider BiduSpider http://www.baidu.com
我们的spider 包下面会多一个文件
这说明我们的spider创建成功。可以在pytharm中使用这个 强大的框架了。
来源:https://blog.csdn.net/skullFang/article/details/78607942
标签:Pycharm,Scrapy,安装
0
投稿
猜你喜欢
MySQL数据库的其它安全问题
2008-12-23 15:40:00
Mysql给普通分页查询结果加序号实操
2024-01-16 21:06:07
MySQL内连接和外连接及七种SQL JOINS的实现
2024-01-21 09:23:16
python中栈的原理及实现方法示例
2023-05-01 02:54:33
使用Python3 poplib模块删除服务器多天前的邮件实现代码
2023-05-08 08:21:54
php中iconv函数使用方法
2023-06-12 08:11:07
MySQL 按指定字段自定义列表排序的实现
2024-01-16 08:09:22
bootstrap-table formatter 使用vue组件的方法
2024-04-29 13:12:37
一文教会你用nginx+uwsgi部署自己的django项目
2021-04-10 17:57:05
Mysql Explain 详解
2010-12-03 16:09:00
ASP程序直接连接MYSQL数据库
2008-10-03 12:13:00
Python操作MySQL简单实现方法
2024-01-19 04:45:44
Python使用re模块正则提取字符串中括号内的内容示例
2022-06-15 14:20:04
HTML与javascript中常用编码浅析
2008-12-23 12:20:00
SQL学习笔记八 索引,表连接,子查询,ROW_NUMBER
2011-09-30 11:18:24
Python3.6笔记之将程序运行结果输出到文件的方法
2023-08-02 08:27:44
SQL Server代理服务无法启动怎么办
2024-01-13 20:27:03
基于PyQt5制作Excel文件数据去重小工具
2023-10-14 05:44:58
基于pdf2docx模块Python实现批量将PDF转Word文档的完整代码教程
2022-06-24 15:55:02
最适合人工智能开发的5种编程语言 附人工智能入门书籍
2023-06-02 03:15:18