您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

python / scikit-learn中距离计算的稀疏实现

5b51 2022/1/14 8:21:12 python 字数 1328 阅读 480 来源 www.jb51.cc/python

我有一个大的(100K×30K)和svmlight格式的(非常)稀疏数据集,我按如下方式加载:import numpy as np from scipy.cluster.vq import kmeans2 from scipy.spatial.distance import pdist, squareform from sklearn.datasets im

概述

我有一个大的(100K×30K)和svmlight格式的(非常)稀疏数据集,我按如下方式加载:

import numpy as np
from scipy.cluster.vq import kmeans2
from scipy.spatial.distance import pdist,squareform
from sklearn.datasets import load_svmlight_file

X,Y = load_svmlight_file("somefile_svm.txt")

它返回一个稀疏的scipy数组X.

我只需要计算所有训练点的成对距离

D = pdist(X)

不幸的是,scipy.spatial.distance中的距离计算实现仅适用于密集矩阵.由于数据集的大小,使用pdist作为不可行

D = pdist(X.todense())

任何有关此问题的稀疏矩阵距离计算实现或变通方法的指针都将非常受欢迎.

非常感谢

然而,稀疏矩阵尚未实现非欧几里德距离.

总结

以上是编程之家为你收集整理的python / scikit-learn中距离计算的稀疏实现全部内容,希望文章能够帮你解决python / scikit-learn中距离计算的稀疏实现所遇到的程序开发问题。


如果您也喜欢它,动动您的小指点个赞吧

除非注明,文章均由 laddyq.com 整理发布,欢迎转载。

转载请注明:
链接:http://laddyq.com
来源:laddyq.com
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


联系我
置顶