您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Beautiful Soup的Python正则表达式

Beautiful Soup的Python正则表达式

我想我知道了:

>>> [div['class'] for div in soup.find_all('div')]
[['comment', 'form', 'new'], ['comment', 'comment-xxxx...']]

请注意,与BS3中的等效项不同,它不是这样的:

['comment form new', 'comment comment-xxxx...']

这就是为什么您的正则表达式不匹配的原因。

但是您可以匹配,例如:

>>> soup.find_all('div', class_=re.compile('comment-'))
[<div class="comment comment-xxxx..."></div>]

请注意,BS等效于BSre.search,而不是re.match,所以您不需要'comment-.*'。当然,如果您想匹配'comment-12345'但不'comment- of-another-kind想要,例如'comment-\d+'

python 2022/1/1 18:36:20 有233人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶