您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

如何在python的scrapy选择器中仅提取文本

如何在python的scrapy选择器中仅提取文本

//h1[@class='state']

在上面的xpath中,你正在选择h1具有class属性标签state

所以这就是为什么它选择所有进入的东西 h1 element

如果你只想选择h1标签文本,则只需

//h1[@class='state']/text()

如果要选择h1标签的文本及其子标签,则必须使用

//h1[@class='state']//text()

因此区别在于/text()特定标签的文本,特定标签的文本//text()及其子标签

下面提到的代码为你工作

site = ''.join(hxs.select("//h1[@class='state']/text()").extract()).strip()
python 2022/1/1 18:18:55 有435人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶