在Elasticsearch中查找最相似的整数数组

我将在去年的Elasticsearch邮件列表中查看去年的讨论。另一个ES用户正在尝试完全按照您的意图进行操作，匹配数组元素并按相似性进行排序。在他的情况下，他的数组成员是“一个”，“两个”，“三个”等，但几乎相同：

http://elasticsearch-users.115913.n3.nabble.com/Similarity-score-in-array- td4041674.html

讨论中指出的问题是，没有什么可以让您准确地找到想要的东西。您使用数组成员（字符串或整数，我认为都可以）的方法可以使您接近，但可能与您要实现的目标有所不同。原因是Elasticsearch（以及Lucene / Solr也是如此）中的默认相似性评分机制是TF / IDF：http ://www.elasticsearch.org/guide/en/elasticsearch/guide/current/relevance- intro.html

TF / IDF可能非常接近，并且取决于用例，可能会为您提供相同的结果，但不能保证做到这一点。经常出现的标签（例如，“ 1”的频率是“ 2”的两倍）会更改每个术语的权重，以致您可能无法完全获得所需的内容。

如果您需要精确的评分/相似度算法，我相信您需要自定义评分。正如您发现的那样，自定义评分脚本无法很好地扩展，因为该脚本将在每个文档中运行，因此开始时并不太快，并且响应时间会以线性方式衰减。

我个人可能会尝试Elasticsearch提供的某些相似性模块，例如BM25：

http://www.elasticsearch.org/guide/zh- CN/elasticsearch/reference/current/index-modules- similarity.html

其他 2022/1/1 18:14:31 有691人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

其他 2022-01-01 1229
如何在Electron.Atom \ WebPack应用程序中使用FS模块？

如何在Electron.Atom \ WebPack应用程序中使用FS模块？

其他 2022-01-01 984
在Eclipse之外将Spring MVC应用程序部署到tomcat的幕后发生了什么？

在Eclipse之外将Spring MVC应用程序部署到tomcat的幕后发生了什么？

Java 2022-01-01 865
Tomcat JDBC连接在Eclipse中有效，但不能独立运行

Tomcat JDBC连接在Eclipse中有效，但不能独立运行

其他 2022-01-01 849
在Elasticsearch中将字符串的默认映射更改为“未分析”

在Elasticsearch中将字符串的默认映射更改为“未分析”

其他 2022-01-01 848
在Emacs中匹配括号的命令是什么？

在Emacs中匹配括号的命令是什么？

其他 2022-01-01 794
在Express中全局重定向所有尾随斜杠

在Express中全局重定向所有尾随斜杠

其他 2022-01-01 768
如何使用Java API在Elasticsearch中分析文本？

如何使用Java API在Elasticsearch中分析文本？

java 2022-01-01 829
在Elasticsearch中，如何将时区应用于脚本化日期操作？

在Elasticsearch中，如何将时区应用于脚本化日期操作？

其他 2022-01-01 974
如何在elascticsearch中使用日期-直方图聚合显示日期名称

如何在elascticsearch中使用日期-直方图聚合显示日期名称

其他 2022-01-01 920
在传递一些上下文时如何在expressjs中重定向？

在传递一些上下文时如何在expressjs中重定向？

其他 2022-01-01 772
在Elasticsearch中，多个顶级文档可以共享一个嵌套文档吗？

在Elasticsearch中，多个顶级文档可以共享一个嵌套文档吗？

其他 2022-01-01 714
如何在Elasticsearch中将CURL转换为URI

如何在Elasticsearch中将CURL转换为URI

其他 2022-01-01 704
如何在Entity Framework中使用unsigned int / long类型？

如何在Entity Framework中使用unsigned int / long类型？

其他 2022-01-01 844
如何在Elasticsearch中排序然后应用限制过滤器

如何在Elasticsearch中排序然后应用限制过滤器

其他 2022-01-01 757
如何在Elasticsearch中按孩子数对父母排序

如何在Elasticsearch中按孩子数对父母排序

其他 2022-01-01 747
在Elasticsearch中关闭和关闭节点之间的区别？

在Elasticsearch中关闭和关闭节点之间的区别？

其他 2022-01-01 762
所有格_英语词干分析器在Elasticsearch中的使用

所有格_英语词干分析器在Elasticsearch中的使用

其他 2022-01-01 860
在Elasticsearch中创建或更新映射

在Elasticsearch中创建或更新映射

其他 2022-01-01 760
部署在Elastic Beanstalk Java环境上的Spring Boot应用程序返回502

部署在Elastic Beanstalk Java环境上的Spring Boot应用程序返回502

java 2022-01-01 758

在Elasticsearch中查找最相似的整数数组

撰写回答

推荐问题

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何在Electron.Atom \ WebPack应用程序中使用FS模块？

在Eclipse之外将Spring MVC应用程序部署到tomcat的幕后发生了什么？

Tomcat JDBC连接在Eclipse中有效，但不能独立运行

在Elasticsearch中将字符串的默认映射更改为“未分析”

在Emacs中匹配括号的命令是什么？

在Express中全局重定向所有尾随斜杠

如何使用Java API在Elasticsearch中分析文本？

在Elasticsearch中，如何将时区应用于脚本化日期操作？

如何在elascticsearch中使用日期-直方图聚合显示日期名称

在传递一些上下文时如何在expressjs中重定向？

在Elasticsearch中，多个顶级文档可以共享一个嵌套文档吗？

如何在Elasticsearch中将CURL转换为URI

如何在Entity Framework中使用unsigned int / long类型？

如何在Elasticsearch中排序然后应用限制过滤器

如何在Elasticsearch中按孩子数对父母排序

在Elasticsearch中关闭和关闭节点之间的区别？

所有格_英语词干分析器在Elasticsearch中的使用

在Elasticsearch中创建或更新映射

部署在Elastic Beanstalk Java环境上的Spring Boot应用程序返回502

分类汇总

您的鼓励是对我最大的支持