当前位置：首页 > ai >正文

Scrapy框架之Scrapyd部署及Gerapy分布式爬虫管理框架的使用

ai 2025/7/1 12:56:49

Scrapyd

Scrapyd 是一个用于部署和运行 Scrapy 爬虫的服务器。

1.安装

Scrapyd服务端：pip install scrapyd
Scrapyd客户端：pip install scrapyd-client

运行scrapyd
在这里插入图片描述
浏览器输入http://127.0.0.1:6800/

2.配置

安装完成后，需要对 Scrapyd 进行配置。通常需要创建一个scrapyd.conf配置文件，该文件用于设置 Scrapyd 的各种参数，如监听端口、日志文件路径、项目存储路径等。
官方配置文件：https://scrapyd.readthedocs.io/en/stable/config.html

[scrapyd]
eggs_dir = eggs
logs_dir = logs
items_dir = 
jobs_to_keep = 5
dbs_dir = dbs
max_proc = 0
max_proc_per_cpu = 4
finished_to_keep = 100
poll_interval = 5.0
bind_address = 0.0.0.0
http_port = 6800
debug = off
runner = scrapyd.runner
application = scrapyd.app.application
launcher = scrapyd.launcher.Launcher
webroot = scrapyd.website.Root

在上述配置中，指定了项目 egg 文件存储目录、日志文件目录、绑定的 IP 地址和端口等信息。你可以根据实际需求对这些配置进行修改。

在这里插入图片描述
打开scrapy项目里面的scrapy.cfg，修改一下

[settings]
default = quotes_scrapy.settings[deploy:Quotes] # deploy冒号后面写部署名
url = http://localhost:6800/
project

查看全文

http://www.xdnf.cn/news/4329.html

记录学习《手动学习深度学习》这本书的笔记（十）

协方差与皮尔逊相关系数：从定义到应用的全面解析

isNotBlank和isNotEmpty有什么区别？

Python学习笔记--FastAPI入门常规操作

penEuler操作系统结合豆包测试github仓库8086-Emulator项目

react中的用法——setDisabled dva dispatch effects

leetcode 160. 相交链表

os梳理5——第五章：存储器管理

汽车免拆诊断案例｜车辆行驶中急加速车身抖动故障排除 2 例

C# NX二次开发：投影曲线和偏置曲线UFUN函数详解

Redis--哈希类型

深度学习中的autograd与jacobian

C++ 日志系统实战第四步：设计与代码实现详解

从0开始学习大模型--Day03--Agent规划与记忆

“胖都来”商标申请可以通过注册不！

如何应对客户在验收后提出新需求？

ESP32蓝牙开发笔记（十四）

Zsh + iTerm2搭配使用教学，非常舒服，macOS

系统架构-云原生架构设计

14前端项目----登录/注册

【强化学习】#4 蒙特卡洛方法

leetcode 70.爬楼梯（c++详细最全解法+补充知识）

C++ 备忘录模式详解

NVM完全指南：安装、配置与最佳实践

尤雨溪宣布：Vue 生态正式引入 AI

医疗人工智能大模型中的关键能力：【中期训练】mid-training

android中的背压问题及解决方案

AOP封装进行批量的数据查询并填充

shell 脚本

Android学习总结之MMKV（代替SharedPreferences）

Scrapyd

1.安装

2.配置

相关文章：