ElasticSearch搜索性能

您可能会达到硬件的极限，但是首先可以对查询做一些事情来帮助优化它。

我要做的第一件事是限制max_expansions。前缀查询的工作方式是生成与查询中的最后一个令牌匹配的前缀列表。在您的搜索查询“ some search term”中，最后一个标记“ term”将使用“ term”作为前缀种子进行扩展。您可以生成如下列表：

前缀扩展过程贯穿您的发布列表，以查找与种子前缀匹配的任何单词。默认情况下，此列表是无限制的，这意味着您可以生成很大的扩展列表。

第二阶段term使用扩展将您的原始查询重写为一系列查询。扩展列表越大，针对您的索引评估的术语越多，并且速度相应降低。

如果将扩展过程限制在合理的范围内，则可以保持速度，并且通常仍会获得良好的前缀匹配：

{
    "query" : {
        "multi_match" : {
            "query" : "some search term",
            "fields" : [ "title", "content" ],
            "type": "phrase_prefix",
            "max_expansions" : 100
        }
    },
    "size": 20,
    "fields" :["article_id", "Feed_id"],

}

您将需要玩几个扩展。这是速度和召回之间的权衡。

通常，您可以添加的另一件事是过滤。如果可以过滤某些类型的条件，则可以极大地提高速度。当前，您的查询是针对整个索引（2.5亿个文档）执行的，需要进行大量评估。如果您可以添加过滤器以减少该数量，则可以看到延迟大大改善了。

归根结底，查询评估的文档越少，查询将运行得越快。过滤器减少了查询将看到，被缓存，运行非常快等的文档数量。

您的情况可能没有任何适用的过滤器，但如果有，它们确实可以提供帮助！

该建议完全取决于系统的其余部分。如果由于进行简单的搜索和过滤（例如，不分面/地理/繁重的排序/脚本）而没有充分利用堆（24gb），则可以将堆重新分配给文件系统缓存。

例如，如果最大堆使用量峰值为12gb，则可以将堆大小减小到15gb。您释放的额外10gb将返回到操作系统并帮助缓存段，这将仅由于更多操作是无盘事实而有助于提高搜索性能。

其他 2022/1/1 18:14:36 有614人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

ESLint-组件应被编写为纯函数（react preferred / stateless function）

ESLint-组件应被编写为纯函数（react preferred / stateless function）

其他 2022-01-01 1147
在JavaScript中删除数组元素-Delete与Splice

在JavaScript中删除数组元素-Delete与Splice

SQL 2022-01-01 1245
无法在Ubuntu上将ElasticSearch作为服务运行

无法在Ubuntu上将ElasticSearch作为服务运行

其他 2022-01-01 971
如何提高Elasticsearch函数得分的字段长度范数？

如何提高Elasticsearch函数得分的字段长度范数？

其他 2022-01-01 1027
Laravel 5：通过数据透视同步额外的字段

Laravel 5：通过数据透视同步额外的字段

其他 2022-01-01 1030
我如何重新连接使用selenium的webdriver打开的浏览器？

我如何重新连接使用selenium的webdriver打开的浏览器？

其他 2022-01-01 1077
elasticsearch-返回字段的标记

elasticsearch-返回字段的标记

其他 2022-01-01 997
{{}}和{!!有什么区别？!!}在laravel刀片文件中？

{{}}和{!!有什么区别？!!}在laravel刀片文件中？

其他 2022-01-01 1405
什么是selenium，什么是WebDriver？

什么是selenium，什么是WebDriver？

其他 2022-01-01 986
尝试使用selenium和python登录网页时出错

尝试使用selenium和python登录网页时出错

python 2022-01-01 1018
在移动设备上进行selenium测试值得吗？

在移动设备上进行selenium测试值得吗？

其他 2022-01-01 879
无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

其他 2022-01-01 1082
在服务器上运行selenium浏览器（Flask / Python / Heroku）

在服务器上运行selenium浏览器（Flask / Python / Heroku）

Python 2022-01-01 1260
Langford序列实现Haskell或C

Langford序列实现Haskell或C

其他 2022-01-01 993
如何在Laravel中使用多个数据库

如何在Laravel中使用多个数据库

其他 2022-01-01 914
Spring Boot和Thymeleaf-再次热插拔模板和资源

Spring Boot和Thymeleaf-再次热插拔模板和资源

Java 2022-01-01 868
如何从javascript中的Razor Model对象获取JSON对象

如何从javascript中的Razor Model对象获取JSON对象

javascript 2022-01-01 939
elasticsearch滚动行为

elasticsearch滚动行为

其他 2022-01-01 988
从Nest客户端elasticsearch2.3序列化查询

从Nest客户端elasticsearch2.3序列化查询

其他 2022-01-01 987
elasticsearch-Ubuntu-拒绝连接

elasticsearch-Ubuntu-拒绝连接

其他 2022-01-01 1006

ElasticSearch搜索性能

撰写回答

推荐问题

ESLint-组件应被编写为纯函数（react preferred / stateless function）

在JavaScript中删除数组元素-Delete与Splice

无法在Ubuntu上将ElasticSearch作为服务运行

如何提高Elasticsearch函数得分的字段长度范数？

Laravel 5：通过数据透视同步额外的字段

我如何重新连接使用selenium的webdriver打开的浏览器？

elasticsearch-返回字段的标记

{{}}和{!!有什么区别？!!}在laravel刀片文件中？

什么是selenium，什么是WebDriver？

尝试使用selenium和python登录网页时出错

在移动设备上进行selenium测试值得吗？

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

在服务器上运行selenium浏览器（Flask / Python / Heroku）

Langford序列实现Haskell或C

如何在Laravel中使用多个数据库

Spring Boot和Thymeleaf-再次热插拔模板和资源

如何从javascript中的Razor Model对象获取JSON对象

elasticsearch滚动行为

从Nest客户端elasticsearch2.3序列化查询

elasticsearch-Ubuntu-拒绝连接

分类汇总

您的鼓励是对我最大的支持