您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

过滤掉HTML标签并解析python中的实体

过滤掉HTML标签并解析python中的实体

使用lxml是最适合python的xml / html库。

import lxml.html
t = lxml.html.fromstring("...")
t.text_content()

如果您只想清理html,请查看lxml.html.clean模块

python 2022/1/1 18:35:59 有226人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶