稀疏稀疏…数组？

使用scipy.sparse基于行或列的格式：csc_matrix和csr_matrix。

它们使用幕后高效的C实现（包括乘法），并且转置是无操作的（尤其是如果调用transpose(copy=False)），就像numpy数组一样。

编辑：通过ipython的一些时间：

import numpy, scipy.sparse
n = 100000
x = (numpy.random.rand(n) * 2).astype(int).astype(float) # 50% sparse vector
x_csr = scipy.sparse.csr_matrix(x)
x_dok = scipy.sparse.dok_matrix(x.reshape(x_csr.shape))

现在x_csr，x_dok稀疏度为50％：

print repr(x_csr)
<1x100000 sparse matrix of type '<type 'numpy.float64'>'
        with 49757 stored elements in Compressed Sparse Row format>

和时间：

timeit numpy.dot(x, x)
10000 loops, best of 3: 123 us per loop

timeit x_dok * x_dok.T
1 loops, best of 3: 1.73 s per loop

timeit x_csr.multiply(x_csr).sum()
1000 loops, best of 3: 1.64 ms per loop

timeit x_csr * x_csr.T
100 loops, best of 3: 3.62 ms per loop

所以看起来我在撒谎。换位很便宜，但CSR * CSC没有高效的C实现（在最新的0.9.0 SciPy的）。每个调用中都会构造一个新的csr对象：-(

作为黑客（尽管现在scipy相对稳定），您可以直接在稀疏数据上进行点积运算：

timeit numpy.dot(x_csr.data, x_csr.data)
10000 loops, best of 3: 62.9 us per loop

请注意，这最后一种方法会再次执行Numpy密集乘法。稀疏度为50％，因此实际上比dot(x, x)2倍快。

其他 2022/1/1 18:30:52 有443人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

复制1TB稀疏文件

复制1TB稀疏文件

其他 2022-01-01 795
将稀疏向量添加为Elasticsearch中的字段

将稀疏向量添加为Elasticsearch中的字段

其他 2022-01-01 498
Java中的稀疏矩阵/数组

Java中的稀疏矩阵/数组

java 2022-01-01 575
Python中稀疏矩阵的矩阵乘法

Python中稀疏矩阵的矩阵乘法

python 2022-01-01 675
Python中稀疏矩阵的矩阵幂

Python中稀疏矩阵的矩阵幂

python 2022-01-01 593
熊猫稀疏dataFrame到稀疏矩阵，而不在内存中生成密集矩阵

熊猫稀疏dataFrame到稀疏矩阵，而不在内存中生成密集矩阵

其他 2022-01-01 508
从numpy python中的稀疏矩阵生成密集矩阵

从numpy python中的稀疏矩阵生成密集矩阵

python 2022-01-01 444
python中的稀疏矩阵svd

python中的稀疏矩阵svd

python 2022-01-01 405
稀疏稀疏…数组？

稀疏稀疏…数组？

其他 2022-01-01 443
规范Scipy稀疏矩阵的有效方法

规范Scipy稀疏矩阵的有效方法

其他 2022-01-01 432
如何处理用户警告：将稀疏的IndexedSlices转换为形状未知的密集张量

如何处理用户警告：将稀疏的IndexedSlices转换为形状未知的密集张量

其他 2022-01-01 497
直接在Scipy稀疏矩阵上使用Intel MKL库来计算内存较少的A点AT

直接在Scipy稀疏矩阵上使用Intel MKL库来计算内存较少的A点AT

其他 2022-01-01 553
使用SciPy / Numpy在Python中连接稀疏矩阵

使用SciPy / Numpy在Python中连接稀疏矩阵

python 2022-01-01 386
稀疏矩阵的元素智能

稀疏矩阵的元素智能

其他 2022-01-01 491
python matplotlib绘制稀疏矩阵模式

python matplotlib绘制稀疏矩阵模式

python 2022-01-01 451
从scipy CSR稀疏矩阵访问值，列索引和row_ptr数据

从scipy CSR稀疏矩阵访问值，列索引和row_ptr数据

其他 2022-01-01 426
使用int列表进行稀疏矩阵切片

使用int列表进行稀疏矩阵切片

其他 2022-01-01 427
以可移植数据格式保存/加载scipy稀疏csr_matrix

以可移植数据格式保存/加载scipy稀疏csr_matrix

其他 2022-01-01 435
如何有效地从稀疏矩阵中删除列？

如何有效地从稀疏矩阵中删除列？

其他 2022-01-01 425
在HDF5（PyTables）中存储Numpy稀疏矩阵

在HDF5（PyTables）中存储Numpy稀疏矩阵

其他 2022-01-01 409

稀疏稀疏…数组？

撰写回答

推荐问题

复制1TB稀疏文件

将稀疏向量添加为Elasticsearch中的字段

Java中的稀疏矩阵/数组

Python中稀疏矩阵的矩阵乘法

Python中稀疏矩阵的矩阵幂

熊猫稀疏dataFrame到稀疏矩阵，而不在内存中生成密集矩阵

从numpy python中的稀疏矩阵生成密集矩阵

python中的稀疏矩阵svd

稀疏稀疏…数组？

规范Scipy稀疏矩阵的有效方法

如何处理用户警告：将稀疏的IndexedSlices转换为形状未知的密集张量

直接在Scipy稀疏矩阵上使用Intel MKL库来计算内存较少的A点AT

使用SciPy / Numpy在Python中连接稀疏矩阵

稀疏矩阵的元素智能

python matplotlib绘制稀疏矩阵模式

从scipy CSR稀疏矩阵访问值，列索引和row_ptr数据

使用int列表进行稀疏矩阵切片

以可移植数据格式保存/加载scipy稀疏csr_matrix

如何有效地从稀疏矩阵中删除列？

在HDF5（PyTables）中存储Numpy稀疏矩阵

分类汇总

您的鼓励是对我最大的支持