当项目获得空字段时，如何重试请求n次？

你可以使用Custom Retry Middleware来做到这一点，你只需要覆盖process_response当前Retry Middleware的方法即可：

from scrapy.downloadermiddlewares.retry import RetryMiddleware
from scrapy.utils.response import response_status_message


class CustomRetryMiddleware(RetryMiddleware):

    def process_response(self, request, response, spider):
        if request.Meta.get('dont_retry', False):
            return response
        if response.status in self.retry_http_codes:
            reason = response_status_message(response.status)
            return self._retry(request, reason, spider) or response

        # this is your check
        if response.status == 200 and response.xpath(spider.retry_xpath):
            return self._retry(request, 'response got xpath "{}"'.format(spider.retry_xpath), spider) or response
        return response

然后启用它，而不是默认RetryMiddleware的settings.py：

DOWNLOADER_MIDDLEWARES = {
    'scrapy.downloadermiddlewares.retry.RetryMiddleware': None,
    'myproject.middlewarefilepath.CustomRetryMiddleware': 550,
}

现在，你有了一个中间件，你可以在其中配置，xpath以使用属性在Spider内部重试retry_xpath：

class MySpider(Spider):
    name = "myspidername"

    retry_xpath = '//h2[@class="tadasdop-cat"]'
    ...

当“项目”的字段为空时，这不一定会重试，但是你可以在此retry_xpath属性中指定该字段的相同路径以使其起作用。

其他 2022/1/1 18:18:16 有450人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

当项目获得空字段时，如何重试请求n次？

当项目获得空字段时，如何重试请求n次？

其他 2022-01-01 450
仅当项目不存在时才插入表中

仅当项目不存在时才插入表中

其他 2022-01-01 544
MySQL获得两个值之间的随机值

MySQL获得两个值之间的随机值

MySQL 2022-01-01 941
如何获得PHP中的类名？

如何获得PHP中的类名？

php 2022-01-01 642
如何获得一个值的价值

如何获得一个值的价值

其他 2022-01-01 663
MySQL select语句是CASE还是IF ELSEIF？不确定如何获得结果

MySQL select语句是CASE还是IF ELSEIF？不确定如何获得结果

MySQL 2022-01-01 773
您如何获得计算机具有的RAM总量？

您如何获得计算机具有的RAM总量？

其他 2022-01-01 879
如何获得所选单选按钮的价值？

如何获得所选单选按钮的价值？

其他 2022-01-01 582
如何使用Selenium WebDriver和Python获得选择的选项？

如何使用Selenium WebDriver和Python获得选择的选项？

python 2022-01-01 514
如何获得Windows显示设置？

如何获得Windows显示设置？

其他 2022-01-01 510
使用df获得可用磁盘空间以仅显示kb中的可用空间吗？

使用df获得可用磁盘空间以仅显示kb中的可用空间吗？

其他 2022-01-01 677
JavaScript如何获得所选单选按钮的价值？

JavaScript如何获得所选单选按钮的价值？

javascript 2022-01-01 652
C＃通用列表如何获得T的类型？[重复]

C＃通用列表如何获得T的类型？[重复]

c# 2022-01-01 647
像在PHP中一样获得一年中的JavaScript

像在PHP中一样获得一年中的JavaScript

php 2022-01-01 544
启动方法中无法获得“通过Java Web Start启动代理”选项

启动方法中无法获得“通过Java Web Start启动代理”选项

java 2022-01-01 604
如何获得承诺的价值？

如何获得承诺的价值？

其他 2022-01-01 540
如何获得最新记录

如何获得最新记录

其他 2022-01-01 560
通过spring数据从elasticsearch获得一个字段

通过spring数据从elasticsearch获得一个字段

Java 2022-01-01 580
如何从访客获得真实IP？

如何从访客获得真实IP？

其他 2022-01-01 550
如果使用HTML5文档类型，为什么不能将div的高度设置为100％？如何获得100％的高度

如果使用HTML5文档类型，为什么不能将div的高度设置为100％？如何获得100％的高度

其他 2022-01-01 691
new Date（new Date（）。getTime（）-25 * 24 * 60 * 60 * 1000）获得了意外日期

new Date（new Date（）。getTime（）-25 * 24 * 60 * 60 * 1000）获得了意外日期

其他 2022-01-01 608
如何获得ASP.NET MVC Ajax响应以重定向到新页面，而不是将视图插入UpdateTargetId？

如何获得ASP.NET MVC Ajax响应以重定向到新页面，而不是将视图插入UpdateTargetId？

dotnet 2022-01-01 545

当项目获得空字段时，如何重试请求n次？

撰写回答

推荐问题

当项目获得空字段时，如何重试请求n次？

仅当项目不存在时才插入表中

MySQL获得两个值之间的随机值

如何获得PHP中的类名？

如何获得一个值的价值

MySQL select语句是CASE还是IF ELSEIF？不确定如何获得结果

您如何获得计算机具有的RAM总量？

如何获得所选单选按钮的价值？

如何使用Selenium WebDriver和Python获得选择的选项？

如何获得Windows显示设置？

使用df获得可用磁盘空间以仅显示kb中的可用空间吗？

JavaScript如何获得所选单选按钮的价值？

C＃通用列表如何获得T的类型？[重复]

像在PHP中一样获得一年中的JavaScript

启动方法中无法获得“通过Java Web Start启动代理”选项

如何获得承诺的价值？

如何获得最新记录

通过spring数据从elasticsearch获得一个字段

如何从访客获得真实IP？

如果使用HTML5文档类型，为什么不能将div的高度设置为100％？如何获得100％的高度

new Date（new Date（）。getTime（）-25 * 24 * 60 * 60 * 1000）获得了意外日期

如何获得ASP.NET MVC Ajax响应以重定向到新页面，而不是将视图插入UpdateTargetId？

分类汇总

您的鼓励是对我最大的支持