从Django视图启动Scrapy

你实际上已经通过编辑回答了它。最好的选择是设置scrapyd服务并进行API调用schedule.json以触??发抓取作业运行。

要进行该API http调用，你可以使用urllib2/ requests，也可以在scrapydAPI- 周围使用包装器python-scrapyd-api：

from scrapyd_api import ScrapydAPI

scrapyd = ScrapydAPI('http://localhost:6800')
scrapyd.schedule('project_name', 'spider_name')

如果我们搁置一边scrapyd并尝试从视图中运行Spider，它将阻止请求，直到扭曲的反应堆停止为止-因此，这实际上不是一种选择。

不过，你可以开始使用celery（与串联django_celery）-定义一个任务，该任务将运行Scrapy Spider，并从django视图中调用该任务。这样，你可以将任务放在队列中，而不会让用户等待爬网完成。

另外，看看django-dynamic-scraper软件包：

Django Dynamic Sc??raper（DDS）是用于Django的应用程序，基于cracking框架Scrapy构建。在保留Scrapy的许多功能的同时，它还允许你通过Django管理界面动态创建和管理蜘蛛。能会朝着正确的方向前进。

Go 2022/1/1 18:22:31 有328人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

angularJS-从div中的mouseclick获取x和y位置

angularJS-从div中的mouseclick获取x和y位置

其他 2022-01-01 649
如何检测从dom元素添加/删除的元素？

如何检测从dom元素添加/删除的元素？

其他 2022-01-01 714
无法从docker-compose连接到docker

无法从docker-compose连接到docker

其他 2022-01-01 655
如何从Docker容器内部连接到计算机的本地主机？

如何从Docker容器内部连接到计算机的本地主机？

其他 2022-01-01 638
从dockerfile编辑文件

从dockerfile编辑文件

其他 2022-01-01 610
将数据从Dynamodb发送到Amazon Elasticsearch的最佳方法

将数据从Dynamodb发送到Amazon Elasticsearch的最佳方法

其他 2022-01-01 630
直接从Django中的urls.py重定向到命名的url模式？

直接从Django中的urls.py重定向到命名的url模式？

Go 2022-01-01 669
CSS-如何从div溢出到整个屏幕宽度

CSS-如何从div溢出到整个屏幕宽度

CSS 2022-01-01 633
如何使用python pandas从Docker容器访问CSV文件（位于pc hdd中）？

如何使用python pandas从Docker容器访问CSV文件（位于pc hdd中）？

python 2022-01-01 673
如何从Docker容器内部获取Docker主机的IP地址

如何从Docker容器内部获取Docker主机的IP地址

其他 2022-01-01 572
从Docker容器访问主机的ssh隧道

从Docker容器访问主机的ssh隧道

其他 2022-01-01 606
从DATE和TIME创建DATETIME

从DATE和TIME创建DATETIME

其他 2022-01-01 544
无法从Docker中运行的服务向kafka生成消息

无法从Docker中运行的服务向kafka生成消息

其他 2022-01-01 679
从docker主机外部与kafka docker容器进行交互

从docker主机外部与kafka docker容器进行交互

其他 2022-01-01 646
使用Jenkins管道构建Docker映像时，如何解决“无法从Docker检索.Id”

使用Jenkins管道构建Docker映像时，如何解决“无法从Docker检索.Id”

其他 2022-01-01 664
如何从Django中的contrib.auth使模型用户中的电子邮件字段唯一

如何从Django中的contrib.auth使模型用户中的电子邮件字段唯一

Go 2022-01-01 619
从Dart中的字符串中删除HTML标签

从Dart中的字符串中删除HTML标签

其他 2022-01-01 636
从Django视图调用REST API

从Django视图调用REST API

Go 2022-01-01 609
当我从Docker容器中运行gdb时不会遇到任何断点

当我从Docker容器中运行gdb时不会遇到任何断点

其他 2022-01-01 739
如何从Docker容器获取主机上的映射端口？

如何从Docker容器获取主机上的映射端口？

其他 2022-01-01 649

从Django视图启动Scrapy

撰写回答

推荐问题

angularJS-从div中的mouseclick获取x和y位置

如何检测从dom元素添加/删除的元素？

无法从docker-compose连接到docker

如何从Docker容器内部连接到计算机的本地主机？

从dockerfile编辑文件

将数据从Dynamodb发送到Amazon Elasticsearch的最佳方法

直接从Django中的urls.py重定向到命名的url模式？

CSS-如何从div溢出到整个屏幕宽度

如何使用python pandas从Docker容器访问CSV文件（位于pc hdd中）？

如何从Docker容器内部获取Docker主机的IP地址

从Docker容器访问主机的ssh隧道

从DATE和TIME创建DATETIME

无法从Docker中运行的服务向kafka生成消息

从docker主机外部与kafka docker容器进行交互

使用Jenkins管道构建Docker映像时，如何解决“无法从Docker检索.Id”

如何从Django中的contrib.auth使模型用户中的电子邮件字段唯一

从Dart中的字符串中删除HTML标签

从Django视图调用REST API

当我从Docker容器中运行gdb时不会遇到任何断点

如何从Docker容器获取主机上的映射端口？

分类汇总

您的鼓励是对我最大的支持