Spark上的Redis：任务不可序列化

在Spark中，RDDs（如此map处）上的函数被序列化并发送给执行程序进行处理。这意味着这些操作中包含的所有元素都应该可序列化。

Redis连接不可序列化，因为它打开了到目标DB的TCP连接，该TCP连接已绑定到创建它的机器。

解决方案是在本地执行上下文中的执行器上创建那些连接。做到这一点的方法很少。我想到的两个是：

mapPartitions 仅需对程序结构进行少量更改即可轻松实现：

val perhit = perhitFile.mapPartitions{partition => 
    val r = new RedisClient("192.168.1.101", 6379) // create the connection in the context of the mapPartition operation
    val res = partition.map{ x =>
        ...
        val refStr = r.hmget(...) // use r to process the local data
    }
    r.close // take care of resources
    res
}

可以使用持有对连接的延迟引用的对象对单例连接管理器进行建模（注意：可变引用也将起作用）。

object RedisConnection extends Serializable {
   lazy val conn: RedisClient = new RedisClient("192.168.1.101", 6379)
}

然后可以使用该对象实例化每个辅助JVM的1个连接，并用作Serializable操作闭包中的对象。

val perhit = perhitFile.map{x => 
    val param = f(x)
    val refStr = RedisConnection.conn.hmget(...) // use RedisConnection to get a connection to the local data
    }
}

使用单例对象的优点是开销较小，因为连接仅由JVM创建一次（而不是每个RDD分区1个）

还有一些缺点：

（*）代码用于说明目的。未经编译或测试。

其他 2022/1/1 18:20:36 有529人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

我应该在Spring Boot项目上的哪里存储开发凭证？

我应该在Spring Boot项目上的哪里存储开发凭证？

Java 2022-01-01 1017
JsonResult在ASP.NET CORE 2.1中返回Json

JsonResult在ASP.NET CORE 2.1中返回Json

dotnet 2022-01-01 1105
如何在Spring MVC中使用AJAX渲染视图

如何在Spring MVC中使用AJAX渲染视图

Java 2022-01-01 1274
当我尝试在Spring Boot应用程序中将自定义错误传递给客户端时发生异常

当我尝试在Spring Boot应用程序中将自定义错误传递给客户端时发生异常

Java 2022-01-01 1119
Java Import package.* vs import package.SpecificType

Java Import package.* vs import package.SpecificType

java 2022-01-01 1158
在mysql sproc中使用变量作为表名

在mysql sproc中使用变量作为表名

MySQL 2022-01-01 1234
在JavaScript中删除数组元素-Delete与Splice

在JavaScript中删除数组元素-Delete与Splice

SQL 2022-01-01 1267
使用Spring Functional Web Framework的REST端点的背压

使用Spring Functional Web Framework的REST端点的背压

Java 2022-01-01 1263
Spring Boot Jersey和监视URL

Spring Boot Jersey和监视URL

Java 2022-01-01 1046
带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

Java 2022-01-01 1117
Spring JdbcTemplate“插入..选择...”不起作用

Spring JdbcTemplate“插入..选择...”不起作用

Java 2022-01-01 1024
JasperReports fillReport太慢且消耗资源

JasperReports fillReport太慢且消耗资源

其他 2022-01-01 1219
Spring JSP页面未评估

Spring JSP页面未评估

Java 2022-01-01 1045
Spring Security自定义过滤器

Spring Security自定义过滤器

Java 2022-01-01 1001
Spring MVC验证继承的类

Spring MVC验证继承的类

Java 2022-01-01 1073
Spring Boot CSS被剥离

Spring Boot CSS被剥离

CSS 2022-01-01 1098
spring同步方法NOT SYNCHRONIZED

spring同步方法NOT SYNCHRONIZED

Java 2022-01-01 1068
是否可以从eclispe中的mysql表生成带有休眠注释的java类文件

是否可以从eclispe中的mysql表生成带有休眠注释的java类文件

MySQL 2022-01-01 1201
如何使用JSON，jQuery将复杂对象数组发布到ASP.NET MVC Controller？

如何使用JSON，jQuery将复杂对象数组发布到ASP.NET MVC Controller？

dotnet 2022-01-01 1151
在Spring MVC控制器中反序列化单属性JSON有效负载

在Spring MVC控制器中反序列化单属性JSON有效负载

Java 2022-01-01 1097

Spark上的Redis：任务不可序列化

撰写回答

推荐问题

我应该在Spring Boot项目上的哪里存储开发凭证？

JsonResult在ASP.NET CORE 2.1中返回Json

如何在Spring MVC中使用AJAX渲染视图

当我尝试在Spring Boot应用程序中将自定义错误传递给客户端时发生异常

Java Import package.* vs import package.SpecificType

在mysql sproc中使用变量作为表名

在JavaScript中删除数组元素-Delete与Splice

使用Spring Functional Web Framework的REST端点的背压

Spring Boot Jersey和监视URL

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

Spring JdbcTemplate“插入..选择...”不起作用

JasperReports fillReport太慢且消耗资源

Spring JSP页面未评估

Spring Security自定义过滤器

Spring MVC验证继承的类

Spring Boot CSS被剥离

spring同步方法NOT SYNCHRONIZED

是否可以从eclispe中的mysql表生成带有休眠注释的java类文件

如何使用JSON，jQuery将复杂对象数组发布到ASP.NET MVC Controller？

在Spring MVC控制器中反序列化单属性JSON有效负载

分类汇总

您的鼓励是对我最大的支持