在一本大书中找到10个最常用的词

：此算法存在问题，特别是递归合并列表使其成为多项式运行时算法。但我将其作为有缺陷的算法的示例留在这里。

您不能丢弃数据块中的任何单词，因为一个单词可能仅在一个数据块中存在100次，而另一个单词在100个不同的数据块中每个存在一次。

但是您仍然可以以类似于MapReduce算法的方式使用块。您将每个块映射到一个单词列表（包括计数），然后通过将单词列表递归合并为一个单词来减少。

在映射步骤中，将每个单词映射到每个块的计数。按 字母顺序排序 ，而不是按计数排序，然后将列表存储到磁盘。现在，您可以线性地成对合并列表，而不必在内存中保留两个以上的单词：

继续执行此成对合并，直到所有文件合并到一个列表中。然后，您可以扫描一次结果列表，并保留十个最常用的单词。

其他 2022/1/1 18:15:34 有579人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何强迫JS进行数学运算，而不是将两个字符串放在一起

如何强迫JS进行数学运算，而不是将两个字符串放在一起

其他 2022-01-01 705
如何在一个servlet的jsp中显示警报，然后重定向到另一个jsp？

如何在一个servlet的jsp中显示警报，然后重定向到另一个jsp？

Jave 2022-01-01 703
在Hibernate中使用HQL在一个表中插入数据

在Hibernate中使用HQL在一个表中插入数据

其他 2022-01-01 765
如何在Python Selenium中实现类似TestNG的功能或在一个测试套件中添加多个单元测试？

如何在Python Selenium中实现类似TestNG的功能或在一个测试套件中添加多个单元测试？

python 2022-01-01 580
我可以在一个Web应用程序中有两个web.xml文件吗？

我可以在一个Web应用程序中有两个web.xml文件吗？

其他 2022-01-01 868
Golang在一个字段中有多个json标记名称

Golang在一个字段中有多个json标记名称

Go 2022-01-01 658
在Linux中，为什么所有进程都存在一个全局/ dev / stdin文件？

在Linux中，为什么所有进程都存在一个全局/ dev / stdin文件？

其他 2022-01-01 634
在一天的特定时间调用javascript函数

在一天的特定时间调用javascript函数

javascript 2022-01-01 561
在一本大书中找到10个最常用的词

在一本大书中找到10个最常用的词

其他 2022-01-01 579
有没有办法在一次动作中折叠Kendo Panelbar的所有面板？

有没有办法在一次动作中折叠Kendo Panelbar的所有面板？

其他 2022-01-01 844
RequestDispatcher是否可以在一个servlet容器中跨多个Web应用程序工作？

RequestDispatcher是否可以在一个servlet容器中跨多个Web应用程序工作？

Jave 2022-01-01 584
在一个Tomcat上运行的多个Spring-boot应用程序

在一个Tomcat上运行的多个Spring-boot应用程序

Java 2022-01-01 607
如何将Spring与休眠会话和事务管理集成在一起？

如何将Spring与休眠会话和事务管理集成在一起？

Java 2022-01-01 629
如何在Java中将在一个类中创建的对象传递给另一个类？

如何在Java中将在一个类中创建的对象传递给另一个类？

java 2022-01-01 582
在Java中，我们可以在一个类中创建多少个构造函数？

在Java中，我们可以在一个类中创建多少个构造函数？

java 2022-01-01 615
将相似的数字有效地分组在一起

将相似的数字有效地分组在一起

其他 2022-01-01 658
如何将Tomcat6的catalina.out文件与Logstash + ElasticSearch + Kibana集成在一起？

如何将Tomcat6的catalina.out文件与Logstash + ElasticSearch + Kibana集成在一起？

其他 2022-01-01 771
JSON，REST，SOAP，WSDL和SOA：它们如何链接在一起

JSON，REST，SOAP，WSDL和SOA：它们如何链接在一起

其他 2022-01-01 598
将DIV堆叠在一起？

将DIV堆叠在一起？

其他 2022-01-01 546
使用vi，如何将CSS规则整合在一起？

使用vi，如何将CSS规则整合在一起？

CSS 2022-01-01 779

在一本大书中找到10个最常用的词

撰写回答

推荐问题

如何强迫JS进行数学运算，而不是将两个字符串放在一起

如何在一个servlet的jsp中显示警报，然后重定向到另一个jsp？

在Hibernate中使用HQL在一个表中插入数据

如何在Python Selenium中实现类似TestNG的功能或在一个测试套件中添加多个单元测试？

我可以在一个Web应用程序中有两个web.xml文件吗？

Golang在一个字段中有多个json标记名称

在Linux中，为什么所有进程都存在一个全局/ dev / stdin文件？

在一天的特定时间调用javascript函数

在一本大书中找到10个最常用的词

有没有办法在一次动作中折叠Kendo Panelbar的所有面板？

RequestDispatcher是否可以在一个servlet容器中跨多个Web应用程序工作？

在一个Tomcat上运行的多个Spring-boot应用程序

如何将Spring与休眠会话和事务管理集成在一起？

如何在Java中将在一个类中创建的对象传递给另一个类？

在Java中，我们可以在一个类中创建多少个构造函数？

将相似的数字有效地分组在一起

如何将Tomcat6的catalina.out文件与Logstash + ElasticSearch + Kibana集成在一起？

JSON，REST，SOAP，WSDL和SOA：它们如何链接在一起

将DIV堆叠在一起？

使用vi，如何将CSS规则整合在一起？

分类汇总

您的鼓励是对我最大的支持