（生物医学）单词词干的所有可能的单词形式完成

此解决方案需要预处理您的语料库。但是一旦完成，这将是一个非常快速的字典查找。

from collections import defaultdict
from stemming.porter2 import stem

with open('/usr/share/dict/words') as f:
    words = f.read().splitlines()

stems = defaultdict(list)

for word in words:
    word_stem = stem(word)
    stems[word_stem].append(word)

if __name__ == '__main__':
    word = 'leukocyte'
    word_stem = stem(word)
    print(stems[word_stem])

对于/usr/share/dict/words语料库，这将产生结果

['leukocyte', "leukocyte's", 'leukocytes']

它使用stemming可以安装的模块

pip install stemming

其他 2022/1/1 18:48:21 有412人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

获取JavaFX中节点的高度（生成布局遍历）

获取JavaFX中节点的高度（生成布局遍历）

java 2022-01-01 684
如何在Python中执行PGP（生成密钥，加密/解密）

如何在Python中执行PGP（生成密钥，加密/解密）

python 2022-01-01 396
（生物医学）单词词干的所有可能的单词形式完成

（生物医学）单词词干的所有可能的单词形式完成

其他 2022-01-01 412
（生物医学）单词词干的所有可能的单词形式完成

（生物医学）单词词干的所有可能的单词形式完成

其他 2022-01-01 412
突出显示字符串中的单词（如果包含关键字）

突出显示字符串中的单词（如果包含关键字）

其他 2022-01-01 889
如何标记由两个单词合并而没有空格的单词

如何标记由两个单词合并而没有空格的单词

其他 2022-01-01 849
有没有一种方法可以将div中的长单词换行？

有没有一种方法可以将div中的长单词换行？

其他 2022-01-01 828
检查字符串是否包含数组中的单词

检查字符串是否包含数组中的单词

其他 2022-01-01 761
如何使用Tampermonkey脚本替换AJAX驱动的页面文本和选择属性中的大量单词？

如何使用Tampermonkey脚本替换AJAX驱动的页面文本和选择属性中的大量单词？

其他 2022-01-01 699
在Java中将单词拆分成字母[重复]

在Java中将单词拆分成字母[重复]

java 2022-01-01 768
javascript中的整个单词匹配

javascript中的整个单词匹配

javascript 2022-01-01 580
使用Elastic Search检索标签内容和带连字符的单词

使用Elastic Search检索标签内容和带连字符的单词

其他 2022-01-01 701
如何反转shell字符串中的单词列表？

如何反转shell字符串中的单词列表？

其他 2022-01-01 500
使用Swift提取字符串中的最后一个单词

使用Swift提取字符串中的最后一个单词

Swift 2022-01-01 631
搜索多个单词elasticsearch haystack

搜索多个单词elasticsearch haystack

其他 2022-01-01 479
将文本分割成单个单词

将文本分割成单个单词

其他 2022-01-01 815
MySQL全文搜索与部分单词

MySQL全文搜索与部分单词

MySQL 2022-01-01 586
中间带有单词的水平线的CSS技术

中间带有单词的水平线的CSS技术

CSS 2022-01-01 520
将一个单词转换为另一个单词的最短路径

将一个单词转换为另一个单词的最短路径

其他 2022-01-01 692
elasticsearch查询字符串不按单词部分搜索

elasticsearch查询字符串不按单词部分搜索

其他 2022-01-01 567
使用JavaScript将数字转换成单词

使用JavaScript将数字转换成单词

javascript 2022-01-01 504
多字段，多单词，不带query_string的匹配

多字段，多单词，不带query_string的匹配

其他 2022-01-01 755
如何从一个文件找到另一个文件中的单词？

如何从一个文件找到另一个文件中的单词？

其他 2022-01-01 640
使用php preg_match（正则表达式）将camelCase单词拆分为单词

使用php preg_match（正则表达式）将camelCase单词拆分为单词

php 2022-01-01 528

（生物医学）单词词干的所有可能的单词形式完成

撰写回答

推荐问题

获取JavaFX中节点的高度（生成布局遍历）

如何在Python中执行PGP（生成密钥，加密/解密）

（生物医学）单词词干的所有可能的单词形式完成

（生物医学）单词词干的所有可能的单词形式完成

突出显示字符串中的单词（如果包含关键字）

如何标记由两个单词合并而没有空格的单词

有没有一种方法可以将div中的长单词换行？

检查字符串是否包含数组中的单词

如何使用Tampermonkey脚本替换AJAX驱动的页面文本和选择属性中的大量单词？

在Java中将单词拆分成字母[重复]

javascript中的整个单词匹配

使用Elastic Search检索标签内容和带连字符的单词

如何反转shell字符串中的单词列表？

使用Swift提取字符串中的最后一个单词

搜索多个单词elasticsearch haystack

将文本分割成单个单词

MySQL全文搜索与部分单词

中间带有单词的水平线的CSS技术

将一个单词转换为另一个单词的最短路径

elasticsearch查询字符串不按单词部分搜索

使用JavaScript将数字转换成单词

多字段，多单词，不带query_string的匹配

如何从一个文件找到另一个文件中的单词？

使用php preg_match（正则表达式）将camelCase单词拆分为单词

分类汇总

您的鼓励是对我最大的支持