对于初学者,BeautifulSoup不再积极维护,并且
作者甚至建议使用lxml之类的
替代方法。
在实际的HTML中,Beautiful Soup的3.1.0版比3.0.8版的效果要差得多。最常见的问题是标签处理不正确,“格式错误的开始标签”错误和“错误的结束标签”错误。本页说明发生了什么,如何解决问题以及您现在可以做什么。
该页面最初写于2009年3月。此后,发布了3.2系列,取代了3.1系列,并且4.x系列的开发也正在进行中。此页面将保留以供历史使用。
请改用3.2.0。
在python中解析HTML-lxml或BeautifulSoup?哪种用途更适合哪种用途?
对于初学者,BeautifulSoup不再积极维护,并且
作者甚至建议使用lxml之类的
替代方法。
在实际的HTML中,Beautiful Soup的3.1.0版比3.0.8版的效果要差得多。最常见的问题是标签处理不正确,“格式错误的开始标签”错误和“错误的结束标签”错误。本页说明发生了什么,如何解决问题以及您现在可以做什么。
该页面最初写于2009年3月。此后,发布了3.2系列,取代了3.1系列,并且4.x系列的开发也正在进行中。此页面将保留以供历史使用。
请改用3.2.0。