您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

从使用urllib2或BeautifulSoup获取的(可能是编码的)字符串中返回小写ASCII字符串

从使用urllib2或BeautifulSoup获取的(可能是编码的)字符串中返回小写ASCII字符串

BeautifulSoup在内部将数据存储为Unicode,因此您无需手动执行字符编码操作。

要在文本中找到关键字(不区分大小写)( 不在 属性值或标记名称中):

#!/usr/bin/env python
import urllib2
from contextlib import closing

import regex # pip install regex
from BeautifulSoup import BeautifulSoup

with closing(urllib2.urlopen(URL)) as page:
     soup = BeautifulSoup(page)
     print soup(text=regex.compile(ur'(?fi)\L<keywords>',
                                   keywords=['your', 'keywords', 'go', 'here']))
其他 2022/1/1 18:30:08 有405人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶