您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

使用Python请求模块下载并保存PDF文件

使用Python请求模块下载并保存PDF文件

response.content在这种情况下,您应该使用:

with open('/tmp/Metadata.pdf', 'wb') as f:
    f.write(response.content)

文件

对于非文本请求,您还可以字节形式访问响应主体:

>>> r.content
b'[{"repository":{"open_issues":0,"url":"https://github.com/...

因此,这意味着:response.text输出作为字符串对象返回,在下载 时使用它。如HTML文件

response.content以字节对象返回输出,在下载 时使用它。如PDF文件,音频文件,图像等。

您还可以使用response.raw代替。但是,当您要下载的文件很大时,请使用它。以下是一个基本示例,您也可以在文档中找到该示例:

import requests

url = 'http://www.hrecos.org//images/Data/forweb/HRTVBSH.Metadata.pdf'
r = requests.get(url, stream=True)

with open('/tmp/Metadata.pdf', 'wb') as fd:
    for chunk in r.iter_content(chunk_size):
        fd.write(chunk)

chunk_size是您要使用的块大小。如果将其设置为2000,则请求将下载该文件的第一个2000字节,将其写入文件,然后一次又一次地执行,除非完成。

这样可以节省您的RAM。但是response.content在这种情况下,我宁愿使用它,因为您的文件很小。如您所见,使用response.raw非常复杂。

关联:

如何使用requests.py在python中下载大文件?

如何使用请求下载图像

python 2022/1/1 18:33:40 有210人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶