您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

从numpy python中的稀疏矩阵生成密集矩阵

从numpy python中的稀疏矩阵生成密集矩阵

我用熊猫解决了这个问题。因为我们要保留文档ID和术语ID。

from pandas import DataFrame

# A sparse matrix in dictionary form (can be a sqlite database). Tuples contains doc_id        and term_id. 
doc_term_dict={('d1','t1'):12, ('d2','t3'):10, ('d3','t2'):5}

#extract all unique documents and terms ids and intialize a empty dataframe.
rows = set([d for (d,t) in doc_term_dict.keys()])  
cols = set([t for (d,t) in doc_term_dict.keys()])
df = DataFrame(index = rows, columns = cols )
df = df.fillna(0)

#assign all nonzero values in dataframe
for key, value in doc_term_dict.items():
    df[key[1]][key[0]] = value

print df

输出

    t2  t3  t1
d2  0  10   0
d3  5   0   0
d1  0   0  12
python 2022/1/1 18:29:09 有444人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶