将RDD划分为长度为n的元组

Olologin的答案几乎是正确的，但我相信您想要做的是将RDD分为3个元组，而不是将RDD分为3个元组。为此，请尝试以下操作：

rdd = sc.parallelize(["e1", "e2", "e3", "e4", "e5", "e6", "e7", "e8", "e9", "e10"])
transformed = rdd.zipWithIndex().groupBy(lambda (_, i): i / 3)
                 .map(lambda (_, list): tuple([elem[0] for elem in list]))

在pyspark中运行时，我得到以下信息：

>>> from __future__ import print_function    
>>> rdd = sc.parallelize(["e1", "e2", "e3", "e4", "e5", "e6", "e7", "e8", "e9", "e10"])
>>> transformed = rdd.zipWithIndex().groupBy(lambda (_, i): i / 3).map(lambda (_, list): tuple([elem[0] for elem in list]))
>>> transformed.foreach(print)
...
('e4', 'e5', 'e6')
('e10',)
('e7', 'e8', 'e9')
('e1', 'e2', 'e3')

其他 2022/1/1 18:44:50 有489人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

将redis部署到heroku无法连接

将redis部署到heroku无法连接

其他 2022-01-01 660
nodejs-第一个参数必须是字符串或Buffer-在将response.write与http.request一起使用时

nodejs-第一个参数必须是字符串或Buffer-在将response.write与http.request一起使用时

Node 2022-01-01 702
如何将React响应下载为文件

如何将React响应下载为文件

其他 2022-01-01 592
将RichFaces 3.3.3部署到具有MyFaces 2.2，PrimeFaces，OmniFaces等的Tomcat

将RichFaces 3.3.3部署到具有MyFaces 2.2，PrimeFaces，OmniFaces等的Tomcat

其他 2022-01-01 624
将RMySQL程序包添加到R失败（在Windows上）？

将RMySQL程序包添加到R失败（在Windows上）？

MySQL 2022-01-01 621
直接将require（'chromedriver）.path传递给selenium-webdriver

直接将require（'chromedriver）.path传递给selenium-webdriver

其他 2022-01-01 664
将robomongo连接到mongoDB docker容器

将robomongo连接到mongoDB docker容器

mongodb 2022-01-01 735
在单个服务器上将Redis用于多个Laravel应用程序的队列

在单个服务器上将Redis用于多个Laravel应用程序的队列

其他 2022-01-01 609
在哪里将robots.txt放入tomcat 7中？

在哪里将robots.txt放入tomcat 7中？

其他 2022-01-01 698
当数据值更改时，如何将redis PUBLISH / SUBSCRIBE与nodejs一起使用来通知客户端？

当数据值更改时，如何将redis PUBLISH / SUBSCRIBE与nodejs一起使用来通知客户端？

Node 2022-01-01 737
将Rtf转换为HTML

将Rtf转换为HTML

其他 2022-01-01 682
将ResultSet移到第一个

将ResultSet移到第一个

其他 2022-01-01 691
SonarQube抱怨将ResponseEntity与通配符一起使用

SonarQube抱怨将ResponseEntity与通配符一起使用

其他 2022-01-01 633
您如何将React.js用于SEO？

您如何将React.js用于SEO？

其他 2022-01-01 737
将Redis用作REST API的中间缓存

将Redis用作REST API的中间缓存

其他 2022-01-01 674
使用Gulp时如何将React设置为生产模式

使用Gulp时如何将React设置为生产模式

其他 2022-01-01 654
如何在Spark 2 Scala中将Row转换为json

如何在Spark 2 Scala中将Row转换为json

其他 2022-01-01 679
如何将root密码设置为null

如何将root密码设置为null

其他 2022-01-01 785
将Redis数据同步到MySQL的最佳策略是什么？

将Redis数据同步到MySQL的最佳策略是什么？

MySQL 2022-01-01 624
将Razor View渲染为ASP.NET Core中的字符串

将Razor View渲染为ASP.NET Core中的字符串

dotnet 2022-01-01 653

将RDD划分为长度为n的元组

撰写回答

推荐问题

将redis部署到heroku无法连接

nodejs-第一个参数必须是字符串或Buffer-在将response.write与http.request一起使用时

如何将React响应下载为文件

将RichFaces 3.3.3部署到具有MyFaces 2.2，PrimeFaces，OmniFaces等的Tomcat

将RMySQL程序包添加到R失败（在Windows上）？

直接将require（'chromedriver）.path传递给selenium-webdriver

将robomongo连接到mongoDB docker容器

在单个服务器上将Redis用于多个Laravel应用程序的队列

在哪里将robots.txt放入tomcat 7中？

当数据值更改时，如何将redis PUBLISH / SUBSCRIBE与nodejs一起使用来通知客户端？

将Rtf转换为HTML

将ResultSet移到第一个

SonarQube抱怨将ResponseEntity与通配符一起使用

您如何将React.js用于SEO？

将Redis用作REST API的中间缓存

使用Gulp时如何将React设置为生产模式

如何在Spark 2 Scala中将Row转换为json

如何将root密码设置为null

将Redis数据同步到MySQL的最佳策略是什么？

将Razor View渲染为ASP.NET Core中的字符串

分类汇总

您的鼓励是对我最大的支持