您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

python-docx:将表解析为Panda Dataframe

python-docx:将表解析为Panda Dataframe

您可以使用以下代码从文档中的数据框中提取表:

from docx import Document
import pandas as pd
document = Document('test.docx')

tables = []
for table in document.tables:
    df = [['' for i in range(len(table.columns))] for j in range(len(table.rows))]
    for i, row in enumerate(table.rows):
        for j, cell in enumerate(row.cells):
            if cell.text:
                df[i][j] = cell.text
    tables.append(pd.DataFrame(df))
print(tables)

您可以从表变量中获取所有表。

python 2022/1/1 18:45:36 有314人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶