的呼叫签名re.sub
为:
re.sub(pattern, repl, string, count=0)
所以
re.sub(ur"[^-' ().,\w]+", '' , u'Castañeda', re.UNICODE)
设置count
为re.UNICODE
,其值为32。
请尝试:
In [57]: re.sub(ur"(?u)[^-' ().,\w]+", '', u'Castañeda')
Out[57]: u'Casta\xf1eda'
放置(?u)
在正则表达式的开头是在正re.UNICODE
则表达式本身中指定标志的另一种方法。您也可以通过(?iLmsux)
这种方式设置其他标志。(有关更多信息,请单击此链接并搜索“(?iLmsux)”。)
同样,的呼叫签名re.split
为:
re.split(pattern, string, maxsplit=0)
解决方法是相同的。