内置unicodedata
模块可以做到这一点:
>>> import unicodedata
>>> foo = u'1234567890'
>>> unicodedata.normalize('NFKC', foo)
u'1234567890'
“ NFKC”代表“规范化形式KC [兼容性分解,后跟规范组合]”,并将全角字符替换为半角字符,这些半角字符与Unicode等效。
请注意,它还会同时规范化所有其他内容,例如单独的重音符号和罗马数字符号。
Python:如何将全角字符替换为半角字符?
内置unicodedata
模块可以做到这一点:
>>> import unicodedata
>>> foo = u'1234567890'
>>> unicodedata.normalize('NFKC', foo)
u'1234567890'
“ NFKC”代表“规范化形式KC [兼容性分解,后跟规范组合]”,并将全角字符替换为半角字符,这些半角字符与Unicode等效。
请注意,它还会同时规范化所有其他内容,例如单独的重音符号和罗马数字符号。