在超过100个不同的正则表达式上循环时，Python re模块的速度降低了20倍

Python为已编译的正则表达式保留内部缓存。每当使用带正则表达式的顶级函数之一时，Python都会首先编译该表达式，然后缓存该编译结果。

>>> import re
>>> re._MAXCACHE
100

一旦超过缓存大小，Python 2 就会清除所有缓存的表达式， 并从干净的缓存开始。Python 3将限制增加到512，但仍然完全清除。

解决方法是让您自己缓存编译：

compiled_expression = re.compile(r'(?i)User [_0-9A-z]+ is ')

compiled_expression.sub(r"User .. is ", s)

您可以functools.partial()将sub()呼叫与替换表达式捆绑在一起：

from functools import partial

compiled_expression = re.compile(r'(?i)User [_0-9A-z]+ is ')
ready_to_use_sub = partial(compiled_expression.sub, r"User .. is ")

然后再ready_to_use_sub(s)用于将编译后的正则表达式模式与特定的替换模式一起使用。

python 2022/1/1 18:47:31 有637人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在超链接的click事件上调用javascript函数

在超链接的click事件上调用javascript函数

javascript 2022-01-01 692
在超出EOF的位置上fseek不会使用feof触发EOF，为什么？

在超出EOF的位置上fseek不会使用feof触发EOF，为什么？

其他 2022-01-01 678
JavaExecutorService在超时后中断任务

JavaExecutorService在超时后中断任务

java 2022-01-01 611
如何在超时后中止multiprocessing.Pool中的任务？

如何在超时后中止multiprocessing.Pool中的任务？

其他 2022-01-01 637
在超过100个不同的正则表达式上循环时，Python re模块的速度降低了20倍

在超过100个不同的正则表达式上循环时，Python re模块的速度降低了20倍

python 2022-01-01 637
如果在超时之前没有收到任何数据，Python的socket.recv（）对于非阻塞套接字返回什么？

如果在超时之前没有收到任何数据，Python的socket.recv（）对于非阻塞套接字返回什么？

python 2022-01-01 589
Alamofire：完成错误-代码：-1001

Alamofire：完成错误-代码：-1001

其他 2022-01-01 718
Java Oracle例外-“列表中的最大表达式数为1000”

Java Oracle例外-“列表中的最大表达式数为1000”

java 2022-01-01 936
Swift 3 / iOS 10泄漏

Swift 3 / iOS 10泄漏

Swift 2022-01-01 848
错误1044（42000）：具有所有特权的“ root”访问被拒绝

错误1044（42000）：具有所有特权的“ root”访问被拒绝

其他 2022-01-01 1030
使用Mac OSX 10.6为Ruby on Rails安装mysql2 gem

使用Mac OSX 10.6为Ruby on Rails安装mysql2 gem

MySQL 2022-01-01 864
为什么在Ubuntu Wily（15.10）的OpenJDK 8中不包含JavaFX？

为什么在Ubuntu Wily（15.10）的OpenJDK 8中不包含JavaFX？

java 2022-01-01 792
Redis的内存使用量是数据的10倍

Redis的内存使用量是数据的10倍

其他 2022-01-01 604
MySQl错误＃1064

MySQl错误＃1064

MySQL 2022-01-01 538
CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

CSS 2022-01-01 679
Django：mysql：1045，“用户拒绝访问

Django：mysql：1045，“用户拒绝访问

MySQL 2022-01-01 873
显示div宽度为100％的边距

显示div宽度为100％的边距

其他 2022-01-01 632
如何在OSX 10.6中将MySQLdb与Python和Django一起使用？

如何在OSX 10.6中将MySQLdb与Python和Django一起使用？

MySQL 2022-01-01 890
Elasticsearch对1000万个事件的索引编制速度

Elasticsearch对1000万个事件的索引编制速度

其他 2022-01-01 634
将Google Maps Container DIV的宽度和高度设置为100％

将Google Maps Container DIV的宽度和高度设置为100％

Go 2022-01-01 672
＃1060-重复的列名'id'

＃1060-重复的列名'id'

其他 2022-01-01 625
n个皇后（n> 1000）的快速启发式算法

n个皇后（n> 1000）的快速启发式算法

其他 2022-01-01 742
UnicodeEncodeError：'charmap'编解码器无法对字符'\ u2010'进行编码：字符映射到

UnicodeEncodeError：'charmap'编解码器无法对字符'\ u2010'进行编码：字符映射到

其他 2022-01-01 645
如何计算数字的2或10的最接近幂？

如何计算数字的2或10的最接近幂？

其他 2022-01-01 734
在Windows 64位版本的WinForms应用程序中，VS2010不会显示未处理的异常消息

在Windows 64位版本的WinForms应用程序中，VS2010不会显示未处理的异常消息

其他 2022-01-01 826
＃1071-指定的密钥太长；最大密钥长度为1000个字节

＃1071-指定的密钥太长；最大密钥长度为1000个字节

其他 2022-01-01 681

在超过100个不同的正则表达式上循环时，Python re模块的速度降低了20倍

撰写回答

推荐问题

在超链接的click事件上调用javascript函数

在超出EOF的位置上fseek不会使用feof触发EOF，为什么？

JavaExecutorService在超时后中断任务

如何在超时后中止multiprocessing.Pool中的任务？

在超过100个不同的正则表达式上循环时，Python re模块的速度降低了20倍

如果在超时之前没有收到任何数据，Python的socket.recv（）对于非阻塞套接字返回什么？

Alamofire：完成错误-代码：-1001

Java Oracle例外-“列表中的最大表达式数为1000”

Swift 3 / iOS 10泄漏

错误1044（42000）：具有所有特权的“ root”访问被拒绝

使用Mac OSX 10.6为Ruby on Rails安装mysql2 gem

为什么在Ubuntu Wily（15.10）的OpenJDK 8中不包含JavaFX？

Redis的内存使用量是数据的10倍

MySQl错误＃1064

CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

Django：mysql：1045，“用户拒绝访问

显示div宽度为100％的边距

如何在OSX 10.6中将MySQLdb与Python和Django一起使用？

Elasticsearch对1000万个事件的索引编制速度

将Google Maps Container DIV的宽度和高度设置为100％

＃1060-重复的列名'id'

n个皇后（n> 1000）的快速启发式算法

UnicodeEncodeError：'charmap'编解码器无法对字符'\ u2010'进行编码：字符映射到

如何计算数字的2或10的最接近幂？

在Windows 64位版本的WinForms应用程序中，VS2010不会显示未处理的异常消息

＃1071-指定的密钥太长；最大密钥长度为1000个字节

分类汇总

您的鼓励是对我最大的支持