正则表达式在Python中拆分单词

可以使用字符串函数代替正则表达式：

to_be_removed = ".,:!" # all characters to be removed
s = "John's mom went there, but he wasn't there. So she said: 'Where are you!!'"

for c in to_be_removed:
    s = s.replace(c, '')
s.split()

，在您的示例中，您不想删除其中的撇号，John's但希望将其删除you!!'。因此，字符串操作在这一点上会失败，因此您需要精细调整的正则表达式。

编辑：可能一个简单的正则表达式可以解决您的问题：

(\w[\w']*)

它将捕获以字母开头的所有字符，并在下一个字符为撇号或字母时继续捕获。

(\w[\w']*\w)

第二个正则表达式适用于非常特殊的情况。…第一个正则表达式可以捕获类似的单词you'。这将避免此情况，并且仅在单词内（而不是开头或结尾）时才捕获撇号。但是在这一点上，情况出现了，您无法Moss' mom使用第二个正则表达式捕获撇号。你必须决定是否将捕获尾随结束机智名撇号小号和界定所有权。

例：

rgx = re.compile("([\w][\w']*\w)")
s = "John's mom went there, but he wasn't there. So she said: 'Where are you!!'"
rgx.findall(s)

["John's", 'mom', 'went', 'there', 'but', 'he', "wasn't", 'there', 'So', 'she', 'said', 'Where', 'are', 'you']

更新2：我在正则表达式中发现了一个错误！它不能捕获单个字母，后跟撇号A'。固定的新正则表达式在这里：

(\w[\w']*\w|\w)

rgx = re.compile("(\w[\w']*\w|\w)")
s = "John's mom went there, but he wasn't there. So she said: 'Where are you!!' 'A a'"
rgx.findall(s)

["John's", 'mom', 'went', 'there', 'but', 'he', "wasn't", 'there', 'So', 'she', 'said', 'Where', 'are', 'you', 'A', 'a']

python 2022/1/1 18:32:45 有215人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

Codeigniter路由正则表达式-在控制器/方法名称中使用破折号

Codeigniter路由正则表达式-在控制器/方法名称中使用破折号

其他 2022-01-01 821
Java正则表达式以匹配ASCII字符

Java正则表达式以匹配ASCII字符

java 2022-01-01 714
正则表达式/代码来修复损坏的序列化PHP数据。

正则表达式/代码来修复损坏的序列化PHP数据。

php 2022-01-01 714
php正则表达式[b]至 ****

php正则表达式[b]至 ****

php 2022-01-01 602
将Javascript正则表达式转换为Java语法

将Javascript正则表达式转换为Java语法

javascript 2022-01-01 828
引用MySQL正则表达式中的组？

引用MySQL正则表达式中的组？

MySQL 2022-01-01 667
转到：正则表达式以交换大小写

转到：正则表达式以交换大小写

其他 2022-01-01 697
正则表达式以匹配Java中的URL

正则表达式以匹配Java中的URL

java 2022-01-01 701
正则表达式中应转义哪些文字字符？

正则表达式中应转义哪些文字字符？

其他 2022-01-01 871
Jenkins脚本化管道中的分支指定符正则表达式

Jenkins脚本化管道中的分支指定符正则表达式

其他 2022-01-01 672
C＃正则表达式匹配不包含某个字符串的字符串？

C＃正则表达式匹配不包含某个字符串的字符串？

c# 2022-01-01 733
如何编写与嵌套括号匹配的递归正则表达式？

如何编写与嵌套括号匹配的递归正则表达式？

其他 2022-01-01 771
PHP正则表达式模式中需要额外的反斜杠

PHP正则表达式模式中需要额外的反斜杠

php 2022-01-01 613
如何使用正则表达式使点匹配换行符

如何使用正则表达式使点匹配换行符

其他 2022-01-01 733
正则表达式加上明星区别？

正则表达式加上明星区别？

其他 2022-01-01 659
正则表达式如何匹配所有标点符号，但排除某些条件

正则表达式如何匹配所有标点符号，但排除某些条件

其他 2022-01-01 864
正则表达式Java

正则表达式Java

java 2022-01-01 650
如何在正则表达式中添加连字符

如何在正则表达式中添加连字符

其他 2022-01-01 613
如何在JavaScript中将长正则表达式拆分为多行？

如何在JavaScript中将长正则表达式拆分为多行？

javascript 2022-01-01 662
sed-如何使用sed做正则表达式组

sed-如何使用sed做正则表达式组

其他 2022-01-01 626

正则表达式在Python中拆分单词

撰写回答

推荐问题

Codeigniter路由正则表达式-在控制器/方法名称中使用破折号

Java正则表达式以匹配ASCII字符

正则表达式/代码来修复损坏的序列化PHP数据。

php正则表达式[b]至 ****

将Javascript正则表达式转换为Java语法

引用MySQL正则表达式中的组？

转到：正则表达式以交换大小写

正则表达式以匹配Java中的URL

正则表达式中应转义哪些文字字符？

Jenkins脚本化管道中的分支指定符正则表达式

C＃正则表达式匹配不包含某个字符串的字符串？

如何编写与嵌套括号匹配的递归正则表达式？

PHP正则表达式模式中需要额外的反斜杠

如何使用正则表达式使点匹配换行符

正则表达式加上明星区别？

正则表达式如何匹配所有标点符号，但排除某些条件

正则表达式Java

如何在正则表达式中添加连字符

如何在JavaScript中将长正则表达式拆分为多行？

sed-如何使用sed做正则表达式组

分类汇总

您的鼓励是对我最大的支持