如何匹配运行时间太长的python中的所有键值对

此处的关键是创建productId的笛卡尔积。参见下面的代码，

result=(main.drop_duplicates(['productId','userId'])
            .assign(cartesian_key=1)
            .pipe(lambda x:x.merge(x,on='cartesian_key'))
            .drop('cartesian_key',axis=1)
            .loc[lambda x:(x.productId_x!=x.productId_y) & (x.userId_x==x.userId_y)]
            .groupby(['productId_x','productId_y']).size()
            .div(data['userId'].nunique()))

result

Prod1   prod2   0.75
Prod1   prod3   0.75
Prod1   prod4   0.75
Prod1   prod5   0.5
prod2   Prod1   0.75
prod2   prod3   0.5
prod2   prod4   0.5
prod2   prod5   0.25
prod3   Prod1   0.75
prod3   prod2   0.5
prod3   prod4   0.5
prod3   prod5   0.5
prod4   Prod1   0.75
prod4   prod2   0.5
prod4   prod3   0.5
prod4   prod5   0.5
prod5   Prod1   0.5
prod5   prod2   0.25
prod5   prod3   0.5
prod5   prod4   0.5

result = (df.groupby(['productId','userId']).size()
            .clip(upper=1)
            .unstack()
            .assign(key=1)
            .reset_index()
            .pipe(lambda x:x.merge(x,on='key'))
            .drop('key',axis=1)
            .loc[lambda x:(x.productId_x!=x.productId_y)]
            .set_index(['productId_x','productId_y'])
            .pipe(lambda x:x.set_axis(x.columns.str.split('_',expand=True),axis=1,inplace=False))
            .swaplevel(axis=1)
            .pipe(lambda x:(x['x']+x['y']))
            .fillna(0)
            .div(2) 
            .mean(axis=1))

python 2022/1/1 18:38:13 有240人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何通过忽略Swift中的关联值来比较枚举和关联值？

如何通过忽略Swift中的关联值来比较枚举和关联值？

Swift 2022-01-01 1135
如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

其他 2022-01-01 1401
如何在JavaScript中将浮点数转换为整数？

如何在JavaScript中将浮点数转换为整数？

javascript 2022-01-01 1275
如何基于EXPLAIN计划优化MySQL查询

如何基于EXPLAIN计划优化MySQL查询

MySQL 2022-01-01 1260
如何在C＃/。NET中查找本地计算机的FQDN？

如何在C＃/。NET中查找本地计算机的FQDN？

c# 2022-01-01 1114
如何在Spring MVC中使用AJAX渲染视图

如何在Spring MVC中使用AJAX渲染视图

Java 2022-01-01 1255
如何在PHP变量中去除空格？

如何在PHP变量中去除空格？

php 2022-01-01 1184
如何枚举JavaScript对象的属性？

如何枚举JavaScript对象的属性？

javascript 2022-01-01 1235
如何立即关闭Node.js HTTP服务器？

如何立即关闭Node.js HTTP服务器？

Node 2022-01-01 1144
如何在IE8和9中支持占位符属性

如何在IE8和9中支持占位符属性

其他 2022-01-01 1167
如何使用jQuery访问父窗口对象？

如何使用jQuery访问父窗口对象？

JS 2022-01-01 1185
如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

其他 2022-01-01 1251
如何使用CSS将跨度更改为类似pre？

如何使用CSS将跨度更改为类似pre？

CSS 2022-01-01 1224
如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

其他 2022-01-01 1236
如何使用C＃获取两个DateTime对象之间的时差？

如何使用C＃获取两个DateTime对象之间的时差？

c# 2022-01-01 1199
Django-如何使用South重命名模型字段？

Django-如何使用South重命名模型字段？

Go 2022-01-01 1443
如何计算回溯算法的时间复杂度？

如何计算回溯算法的时间复杂度？

其他 2022-01-01 1230
如何在.htaccess中隐藏.php扩展名

如何在.htaccess中隐藏.php扩展名

php 2022-01-01 1272
使用GhostDriver时如何设置屏幕/窗口大小

使用GhostDriver时如何设置屏幕/窗口大小

其他 2022-01-01 1313
如何在html5中制作透明画布？

如何在html5中制作透明画布？

其他 2022-01-01 1197

如何匹配运行时间太长的python中的所有键值对

撰写回答

推荐问题

如何通过忽略Swift中的关联值来比较枚举和关联值？

如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

如何在JavaScript中将浮点数转换为整数？

如何基于EXPLAIN计划优化MySQL查询

如何在C＃/。NET中查找本地计算机的FQDN？

如何在Spring MVC中使用AJAX渲染视图

如何在PHP变量中去除空格？

如何枚举JavaScript对象的属性？

如何立即关闭Node.js HTTP服务器？

如何在IE8和9中支持占位符属性

如何使用jQuery访问父窗口对象？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

如何使用CSS将跨度更改为类似pre？

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何使用C＃获取两个DateTime对象之间的时差？

Django-如何使用South重命名模型字段？

如何计算回溯算法的时间复杂度？

如何在.htaccess中隐藏.php扩展名

使用GhostDriver时如何设置屏幕/窗口大小

如何在html5中制作透明画布？

分类汇总

您的鼓励是对我最大的支持