这应该很简单:
dense = X.toarray()
TfIdfVectorizer.fit_transform()
返回一个SciPycsr_matrix()
(压缩稀疏行矩阵),该toarray()
方法具有一个专门用于此目的的方法。SciPy中有几种格式的稀疏矩阵,但是它们都有一种.toarray()
方法。
请注意,对于大型矩阵,相比于稀疏矩阵,这将使用大量内存,因此通常,将其保持为尽可能长的稀疏状态是一种很好的方法。
如何使TF-IDF矩阵密集?
这应该很简单:
dense = X.toarray()
TfIdfVectorizer.fit_transform()
返回一个SciPycsr_matrix()
(压缩稀疏行矩阵),该toarray()
方法具有一个专门用于此目的的方法。SciPy中有几种格式的稀疏矩阵,但是它们都有一种.toarray()
方法。
请注意,对于大型矩阵,相比于稀疏矩阵,这将使用大量内存,因此通常,将其保持为尽可能长的稀疏状态是一种很好的方法。