有没有办法使用Python从“网站按钮单击”中下载csv文件？

首先，您应该了解基于 HTTP协议。JavaScript执行的最终结果将形成HTTP请求，该请求使服务器以文件内容作为响应。您需要“反向”网页，找到如何创建适当的请求并像完成操作一样重复该请求。

searchTerm=

country= sectoral_scope=0 recentProjects= sort=projectId dir=DESC formatType=csv

该信息足以尝试在Python中重复此请求。

让我们编写一个小的脚本，该脚本形成并发送相同的请求并将结果保存到.csv文件中：

import requests

data = {
    "searchTerm": "",
    "country": "",
    "sectoral_scope": "0",
    "recentProjects": "",
    "sort": "projectId",
    "dir": "DESC",
    "formatType": "csv"
}

file = requests.post("https://www.vcsprojectdatabase.org/services/publicViewServices/fetchProjectsExport", data)

with open("res.csv", "wb+") as f:
    f.write(file.content)

启动它，就可以了。res.csv包含正确的结果。

通常情况并不是那么容易。为了让我们的请求和浏览器发送的一样，我们应该看一下请求标头。要捕获来自浏览器的HTTP请求，我们可以打开“网络”标签：

现在，让我们按网页上的下载按钮并下载csv文件。现在，在请求表中，我们可以看到我们的发布请求。单击它，然后在“请求标头”部分的“标头”选项卡上进行查看。

有Cookie标头，大多数情况下，例如请求并不重要，可能会被遗漏。但是，如果您对请求有一些问题，则应该查看以前的请求，Set- Cookie在服务器响应中找到带有标头的请求，然后重复执行。

让我们改进脚本并从浏览器复制重要的标头 （Host，Content- Length，Connection，因为我们不包括在内，因为Python请求模块会自动添加它们；根本不需要DNT和Upgrade-Insecure- Requests） 标头。

import requests

data = {
    "searchTerm": "",
    "country": "",
    "sectoral_scope": "0",
    "recentProjects": "",
    "sort": "projectId",
    "dir": "DESC",
    "formatType": "csv"
}

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:66.0) Gecko/20100101 Firefox/66.0",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
    "Accept-Language":  "en-US,en;q=0.5",
    "Accept-Encoding": "gzip, deflate, br",
    "Referer": "https://www.vcsprojectdatabase.org/",
    "Content-Type": "application/x-www-form-urlencoded"
}

file = requests.post("https://www.vcsprojectdatabase.org/services/publicViewServices/fetchProjectsExport", data,
                     headers=headers)

with open("res.csv", "wb+") as f:
    f.write(file.content)

别忘了向网站所有者寻求许可

python 2022/1/1 18:26:30 有264人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在Jenkins API中，有没有办法找到上一个版本的git commit？

在Jenkins API中，有没有办法找到上一个版本的git commit？

其他 2022-01-01 975
有没有办法一次从Redis列表中弹出所有列表项？

有没有办法一次从Redis列表中弹出所有列表项？

其他 2022-01-01 1129
有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

其他 2022-01-01 822
有没有办法根据其父元素放置z-index

有没有办法根据其父元素放置z-index

其他 2022-01-01 864
有没有一种方法可以将div中的长单词换行？

有没有一种方法可以将div中的长单词换行？

其他 2022-01-01 826
有没有可以验证SQL语法的Java库？

有没有可以验证SQL语法的Java库？

SQLServer 2022-01-01 858
有没有一种方法可以检查处理器缓存是否最近已刷新？

有没有一种方法可以检查处理器缓存是否最近已刷新？

其他 2022-01-01 1093
有没有一种方法可以为整个应用程序设置文化？所有当前线程和新线程？

有没有一种方法可以为整个应用程序设置文化？所有当前线程和新线程？

其他 2022-01-01 819
有没有办法删除div但保留其元素？

有没有办法删除div但保留其元素？

其他 2022-01-01 832
Elasticsearch：有没有一种方法可以将对象字段的所有（可能是动态的）子字段声明为字符串？

Elasticsearch：有没有一种方法可以将对象字段的所有（可能是动态的）子字段声明为字符串？

其他 2022-01-01 828
在Angular中阻止多个$ http请求。有没有更好的办法？

在Angular中阻止多个$ http请求。有没有更好的办法？

其他 2022-01-01 907
有没有一种方法可以使用JPA批注和Hibernate动态选择@GeneratedValue策略？

有没有一种方法可以使用JPA批注和Hibernate动态选择@GeneratedValue策略？

其他 2022-01-01 902
有没有一种方法可以模拟Java中的C ++“朋友”概念？

有没有一种方法可以模拟Java中的C ++“朋友”概念？

java 2022-01-01 828
有没有办法在JavaScript的函数调用中提供命名参数？

有没有办法在JavaScript的函数调用中提供命名参数？

javascript 2022-01-01 813
有没有办法在C＃中实现自定义语言功能？

有没有办法在C＃中实现自定义语言功能？

c# 2022-01-01 895
有没有办法在InitState方法上加载异步数据？

有没有办法在InitState方法上加载异步数据？

其他 2022-01-01 895
有没有办法正确整合spring-batch-admin和spring-boot？

有没有办法正确整合spring-batch-admin和spring-boot？

Java 2022-01-01 895
有没有一种简单的方法可以使Sequelize以特定格式返回其日期/时间字段？

有没有一种简单的方法可以使Sequelize以特定格式返回其日期/时间字段？

其他 2022-01-01 832
有没有办法在tomcat中获取上下文根的绝对路径？

有没有办法在tomcat中获取上下文根的绝对路径？

其他 2022-01-01 923
有没有办法在Flutter中的多个PageRoutes中使用InheritedWidget？

有没有办法在Flutter中的多个PageRoutes中使用InheritedWidget？

其他 2022-01-01 812

有没有办法使用Python从“网站按钮单击”中下载csv文件？

撰写回答

推荐问题

在Jenkins API中，有没有办法找到上一个版本的git commit？

有没有办法一次从Redis列表中弹出所有列表项？

有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

有没有办法根据其父元素放置z-index

有没有一种方法可以将div中的长单词换行？

有没有可以验证SQL语法的Java库？

有没有一种方法可以检查处理器缓存是否最近已刷新？

有没有一种方法可以为整个应用程序设置文化？所有当前线程和新线程？

有没有办法删除div但保留其元素？

Elasticsearch：有没有一种方法可以将对象字段的所有（可能是动态的）子字段声明为字符串？

在Angular中阻止多个$ http请求。有没有更好的办法？

有没有一种方法可以使用JPA批注和Hibernate动态选择@GeneratedValue策略？

有没有一种方法可以模拟Java中的C ++“朋友”概念？

有没有办法在JavaScript的函数调用中提供命名参数？

有没有办法在C＃中实现自定义语言功能？

有没有办法在InitState方法上加载异步数据？

有没有办法正确整合spring-batch-admin和spring-boot？

有没有一种简单的方法可以使Sequelize以特定格式返回其日期/时间字段？

有没有办法在tomcat中获取上下文根的绝对路径？

有没有办法在Flutter中的多个PageRoutes中使用InheritedWidget？

分类汇总

您的鼓励是对我最大的支持