您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python和带Unicode的正则表达式

Python和带Unicode的正则表达式

您使用的是python 2.x还是3.0?

如果您使用的是2.x,请尝试使用“ u”使正则表达式字符串成为unicode-escape字符串。由于它是正则表达式,因此最好使用“ r”将正则表达式字符串设置为原始字符串。另外,将整个模式放在括号中也是多余的。

re.sub(ur'[\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+', '', ...)

http://docs.python.org/tutorial/introduction.html#unicode- strings

编辑:

将re.UNICODE / re.U /(?u)标志用于unicode正则表达式也是一种好习惯,但它只会影响\ w或\ b这样的字符类别名,而该模式不使用任何别名,因此不会受到影响。

python 2022/1/1 18:33:46 有207人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶