使用Python将HTML渲染为纯文本
BeautifulSoup是一个抓取库,因此它可能不是进行HTML渲染的最佳选择。如果不是必须使用BeautifulSoup,则应查看html2text。例如:
html2text
import html2text html = open("foobar.html").read() print html2text.html2text(html)
输出:
一些文字更多文字甚至更多文字 * 项目清单 *另一个清单项目 其他一些文字 * 项目清单 *另一个清单项目
你尚未登录,登录后可以
和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进,让解决方法与时俱进
联系我
602392714
清零编程群