我见过的最好的软件包是Gensim,可以在Gensim主页上找到。我已经使用过很多次了,总体上对它的易用性感到非常满意。它是用Python编写的,并且具有易于理解的入门指南,其中比较了9个字符串。它可以通过pip进行安装,所以希望您不会有太多麻烦来安装它。
您使用哪种评分算法在很大程度上取决于问题的背景,但是如果您需要基本的知识,建议从LSI功能入手。(这是本教程向您介绍的内容。)
如果您学习gensim教程,它将使用“相似性”功能引导您比较两个字符串。这将使您可以根据它们包含的文本来查看您的ing彼此之间或与其他some之间的比较。
如果您对它的工作原理感兴趣,请查看本文。