您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

使用Python pdfMiner每页提取文本?

5b51 2022/1/14 8:22:10 python 字数 757 阅读 536 来源 www.jb51.cc/python

我已经尝试了pyPdf和pdfMiner来从pdf文件中提取文本.我有一些不友好的pdf,只有pdfMiner才能成功提取.我使用代码 here来提取整个文件的文本.但是,我真的想在每页上提取文本,如pyPdf中的getPage(i).extractText()功能.有谁知道如何使用pdfMiner提取每页文本? for pageNumber, page in enumerate(PDFDocum

概述

for pageNumber,page in enumerate(PDFDocument.get_pages()):
    if pageNumber == 42:
        #do something with the page

有一篇非常好的文章here.

总结

以上是编程之家为你收集整理的使用Python pdfMiner每页提取文本?全部内容,希望文章能够帮你解决使用Python pdfMiner每页提取文本?所遇到的程序开发问题。


如果您也喜欢它,动动您的小指点个赞吧

除非注明,文章均由 laddyq.com 整理发布,欢迎转载。

转载请注明:
链接:http://laddyq.com
来源:laddyq.com
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


联系我
置顶