我正在使用,并建议使用 和 来解析HTML。几个月前,我不得不编写一个Web抓取机器人,并尝试了所有流行的替代方法,包括 和 ,我使用了 和 的语法糖。我还没有尝试过 。
就我所看到的而言, 或多或少是功能最丰富的库,与其替代方案相比,其底层C核心具有出色的性能。至于 ,我真的很喜欢它的jQuery启发式语法,这使DOM导航更加愉快。
如果您决定尝试一下,以下是一些有用的资源:
好吧,那是我的2c :)我希望这会有所帮助。
使用Python 2.7解析HTML-HTMLParser,SGMLParser还是Beautiful Soup?
我正在使用,并建议使用 和 来解析HTML。几个月前,我不得不编写一个Web抓取机器人,并尝试了所有流行的替代方法,包括 和 ,我使用了 和 的语法糖。我还没有尝试过 。
就我所看到的而言, 或多或少是功能最丰富的库,与其替代方案相比,其底层C核心具有出色的性能。至于 ,我真的很喜欢它的jQuery启发式语法,这使DOM导航更加愉快。
如果您决定尝试一下,以下是一些有用的资源:
好吧,那是我的2c :)我希望这会有所帮助。