从美丽的汤中提取href

如果您打印响应内容（即googleSoup.text），则会看到您得到的HTML完全不同。页面源和响应内容不匹配。

因为内容是动态加载的，所以发生这种情况。即便如此，页面源和响应内容也是相同的。（但是您在检查元素时看到的HTML是不同的。）

对此的基本解释是Google可以识别Python脚本并更改其响应。

您可以传递假的 User- Agent，以使脚本看起来像真实的浏览器请求。

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'}

r = requests.get('https://www.google.co.in/search?q=chocolate', headers=headers)
soup = BeautifulSoup(r.text, 'lxml')

elements = soup.select('.r a')
print(elements[0]['href'])

：

https://en.wikipedia.org/wiki/Chocolate

其他 2022/1/1 18:31:25 有472人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

从美丽的汤中提取href

从美丽的汤中提取href

其他 2022-01-01 472
从美丽的汤中提取href

从美丽的汤中提取href

其他 2022-01-01 472
如何在美丽的汤中添加嵌套元素

如何在美丽的汤中添加嵌套元素

其他 2022-01-01 487
美丽的汤并通过ID提取div及其内容

美丽的汤并通过ID提取div及其内容

其他 2022-01-01 491
美丽的汤和餐桌刮面-LXML与HTML解析器

美丽的汤和餐桌刮面-LXML与HTML解析器

其他 2022-01-01 475
美丽的汤来解析URL以获取另一个URL数据

美丽的汤来解析URL以获取另一个URL数据

其他 2022-01-01 490
使用pip安装漂亮的汤

使用pip安装漂亮的汤

其他 2022-01-01 410
如何从C＃中的MS Office文档中提取文本

如何从C＃中的MS Office文档中提取文本

c# 2022-01-01 889
如何仅提取ELF部分的原始内容？

如何仅提取ELF部分的原始内容？

其他 2022-01-01 623
JSON字符串数组（无对象），提取数据

JSON字符串数组（无对象），提取数据

其他 2022-01-01 547
在Java（JSP）中提取.tar.gz文件

在Java（JSP）中提取.tar.gz文件

java 2022-01-01 580
如何使用Selenium Python从reddit.com搜索页面上的问题中提取标题和href属性

如何使用Selenium Python从reddit.com搜索页面上的问题中提取标题和href属性

python 2022-01-01 602
为目录中的每个zip文件创建一个专用文件夹并提取zip文件

为目录中的每个zip文件创建一个专用文件夹并提取zip文件

其他 2022-01-01 683
PHP子字符串提取。获取第一个'/'之前的字符串或整个字符串

PHP子字符串提取。获取第一个'/'之前的字符串或整个字符串

php 2022-01-01 510
Golang-如何将XML文件的一部分提取为字符串？

Golang-如何将XML文件的一部分提取为字符串？

Go 2022-01-01 608
使用Swift提取字符串中的最后一个单词

使用Swift提取字符串中的最后一个单词

Swift 2022-01-01 621
尝试从专用ECR提取图像时“没有基本身份验证凭据”

尝试从专用ECR提取图像时“没有基本身份验证凭据”

其他 2022-01-01 884
jar文件如何执行？这些课程会被提取吗？

jar文件如何执行？这些课程会被提取吗？

其他 2022-01-01 533
从HTML Java提取文本

从HTML Java提取文本

java 2022-01-01 610
查询以提取超过30m年前更新的时间戳不起作用

查询以提取超过30m年前更新的时间戳不起作用

其他 2022-01-01 637
提取API请求超时？

提取API请求超时？

其他 2022-01-01 609
Linux bash脚本提取IP地址

Linux bash脚本提取IP地址

其他 2022-01-01 611
Spring-Cloud-Stream Kafka Azure-提取数据时出现意外错误代码13

Spring-Cloud-Stream Kafka Azure-提取数据时出现意外错误代码13

Java 2022-01-01 478
在PHP中，如何从一个文本块中提取多个电子邮件地址并将其放入数组中？

在PHP中，如何从一个文本块中提取多个电子邮件地址并将其放入数组中？

php 2022-01-01 644
如何使用JS提取API上传文件？

如何使用JS提取API上传文件？

其他 2022-01-01 477
有没有一种方法可以使用PDO提取按指定列的值分组的关联数组？

有没有一种方法可以使用PDO提取按指定列的值分组的关联数组？

其他 2022-01-01 574
如何在Perl中从HTML提取URL和链接文本？

如何在Perl中从HTML提取URL和链接文本？

其他 2022-01-01 576

从美丽的汤中提取href

撰写回答

推荐问题

从美丽的汤中提取href

从美丽的汤中提取href

如何在美丽的汤中添加嵌套元素

美丽的汤并通过ID提取div及其内容

美丽的汤和餐桌刮面-LXML与HTML解析器

美丽的汤来解析URL以获取另一个URL数据

使用pip安装漂亮的汤

如何从C＃中的MS Office文档中提取文本

如何仅提取ELF部分的原始内容？

JSON字符串数组（无对象），提取数据

在Java（JSP）中提取.tar.gz文件

如何使用Selenium Python从reddit.com搜索页面上的问题中提取标题和href属性

为目录中的每个zip文件创建一个专用文件夹并提取zip文件

PHP子字符串提取。获取第一个'/'之前的字符串或整个字符串

Golang-如何将XML文件的一部分提取为字符串？

使用Swift提取字符串中的最后一个单词

尝试从专用ECR提取图像时“没有基本身份验证凭据”

jar文件如何执行？这些课程会被提取吗？

从HTML Java提取文本

查询以提取超过30m年前更新的时间戳不起作用

提取API请求超时？

Linux bash脚本提取IP地址

Spring-Cloud-Stream Kafka Azure-提取数据时出现意外错误代码13

在PHP中，如何从一个文本块中提取多个电子邮件地址并将其放入数组中？

如何使用JS提取API上传文件？

有没有一种方法可以使用PDO提取按指定列的值分组的关联数组？

如何在Perl中从HTML提取URL和链接文本？

分类汇总

您的鼓励是对我最大的支持