您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

删除python中的所有html?

删除python中的所有html?

.text_content()在元素上尝试该方法,可能是最好的方法,用于lxml.html.clean去除不需要的内容(脚本标签等)。例如:

from lxml import html
from lxml.html.clean import clean_html

tree = html.parse('http://www.example.com')
tree = clean_html(tree)

text = tree.getroot().text_content()
python 2022/1/1 18:48:07 有318人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶