您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

如何使用Python保存“完整网页”而不仅仅是基本html

如何使用Python保存“完整网页”而不仅仅是基本html

尝试使用selenium模拟您的浏览器。该脚本将弹出save as网页对话框。您仍然需要弄清楚如何模拟按Enter键开始下载,因为文件对话框超出了硒的范围(您的操作方式也取决于OS)。

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys

br = webdriver.Firefox()
br.get('http://www.google.com/')

save_me = ActionChains(br).key_down(Keys.CONTROL)\
         .key_down('s').key_up(Keys.CONTROL).key_up('s')
save_me.perform()

我也认为遵循 @Amber 建议来获取链接的资源可能更简单,因此是更好的解决方案。不过,我认为使用硒是一个不错的起点,因为它br.page_source将使您了解整个dom以及javascript生成的动态内容

python 2022/1/1 18:26:54 有205人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶