您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

使用jaccard相似度的Python Pandas距离矩阵

使用jaccard相似度的Python Pandas距离矩阵

查看文档,jaccardin的实现scipy.spatial.distance是jaccard不相似 ,而不是相似。这是使用jaccard作为度量标准时计算距离的常用方法。这样做的原因是,为了成为度量标准,相同点之间的距离必须为零。

在您的代码中,应将0和1之间的差异最小化。在相异的情况下,其他值也看起来正确。

如果要相似而不是不相似,只需从1中减去不相似即可。

res = 1 - pdist(df[['category1','category2','category3']], 'jaccard')
python 2022/1/1 18:29:10 有419人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶