您需要在此处使用原始字符串,以便不会将反斜杠作为转义字符进行处理:
>>> import re
>>> fileText = '<text top="52" left="20" width="383" height="15" font="0"><b>test</b></text>'
>>> fileText = re.sub("<b>(.*?)</b>", r"\1", fileText, flags=re.DOTALL)
>>> fileText
'<text top="52" left="20" width="383" height="15" font="0">test</text>'
>>>
注意如何"\1"
更改为r"\1"
。尽管这是一个很小的更改(一个字符),但效果却很大。见下文:
>>> "\1"
'\x01'
>>> r"\1"
'\\1'
>>>