您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

检查PDF文件在Python中是否有效

检查PDF文件在Python中是否有效

用于Python的两个最常用的PDF库是:

两者都是纯python,因此应该易于安装以及跨平台。

有了pyPdf,它可能和做起来一样简单:

from pyPdf import PdfFileReader
doc = PdfFileReader(file("upload.pdf", "rb"))

这应该足够了,但是如果您要进行进一步检查,doc现在将具有documentInfo()numPages()方法

正如Carl回答的那样,pdftotext也是一个很好的解决方案,并且在非常大的文档(尤其是具有很多交叉引用的文档)上可能会更快。但是,由于分叉新进程的系统开销等原因,在小PDF上可能会稍慢一些。

python 2022/1/1 18:44:20 有290人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶