您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python中的正则表达式和Unicode:sub和findall之间的区别

Python中的正则表达式和Unicode:sub和findall之间的区别

的呼叫签名re.sub为:

re.sub(pattern, repl, string, count=0)

所以

re.sub(ur"[^-' ().,\w]+", '' , u'Castañeda', re.UNICODE)

设置countre.UNICODE,其值为32。

请尝试:

In [57]: re.sub(ur"(?u)[^-' ().,\w]+", '', u'Castañeda')
Out[57]: u'Casta\xf1eda'

放置(?u)在正则表达式的开头是在正re.UNICODE则表达式本身中指定标志的另一种方法。您也可以通过(?iLmsux)这种方式设置其他标志。(有关更多信息,请单击此链接搜索“(?iLmsux)”。)

同样,的呼叫签名re.split为:

re.split(pattern, string, maxsplit=0)

解决方法是相同的。

python 2022/1/1 18:28:59 有194人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶