检查PDF文件在Python中是否有效

用于Python的两个最常用的PDF库是：

两者都是纯python，因此应该易于安装以及跨平台。

有了pyPdf，它可能和做起来一样简单：

from pyPdf import PdfFileReader
doc = PdfFileReader(file("upload.pdf", "rb"))

这应该足够了，但是如果您要进行进一步检查，doc现在将具有documentInfo() 和numPages()方法。

正如Carl回答的那样，pdftotext也是一个很好的解决方案，并且在非常大的文档（尤其是具有很多交叉引用的文档）上可能会更快。但是，由于分叉新进程的系统开销等原因，在小PDF上可能会稍慢一些。

python 2022/1/1 18:44:20 有290人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

检查所有数组项是否为空PHP

检查所有数组项是否为空PHP

php 2022-01-01 919
如何使用PHP检查目录是否为空？

如何使用PHP检查目录是否为空？

php 2022-01-01 973
检查网站是否在iframe中

检查网站是否在iframe中

其他 2022-01-01 949
无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

其他 2022-01-01 1085
如何检查存储在变量中的给定文件描述符是否仍然有效？

如何检查存储在变量中的给定文件描述符是否仍然有效？

其他 2022-01-01 884
如何检查是否使用Javascript加载了外部（跨域）CSS文件

如何检查是否使用Javascript加载了外部（跨域）CSS文件

javascript 2022-01-01 894
如何检查HTML页面中是否加载了嵌入式SVG文档？

如何检查HTML页面中是否加载了嵌入式SVG文档？

其他 2022-01-01 876
React是否总是检查整个树？

React是否总是检查整个树？

其他 2022-01-01 866
如何在使用@ConditionalOnProperty或@ConditionalOnExpression时检查两个条件

如何在使用@ConditionalOnProperty或@ConditionalOnExpression时检查两个条件

其他 2022-01-01 971
通过预处理检查O（1）中是否有2个树节点相关（祖先/后代）

通过预处理检查O（1）中是否有2个树节点相关（祖先/后代）

其他 2022-01-01 883
检查元素上是否存在事件

检查元素上是否存在事件

其他 2022-01-01 736
Hibernate：检查对象是否存在

Hibernate：检查对象是否存在

其他 2022-01-01 837
如何编写算法来检查数组/列表中任何两个数字的和是否与给定数字匹配？

如何编写算法来检查数组/列表中任何两个数字的和是否与给定数字匹配？

其他 2022-01-01 749
JavaScript / jQuery检查断开的链接

JavaScript / jQuery检查断开的链接

javascript 2022-01-01 758
检查字符串是否包含数组中的单词

检查字符串是否包含数组中的单词

其他 2022-01-01 748
如何检查PHP数组是关联数组还是顺序数组？

如何检查PHP数组是关联数组还是顺序数组？

php 2022-01-01 803
使用Java检查变量是否在两个数字之间

使用Java检查变量是否在两个数字之间

java 2022-01-01 732
休眠检查线程中与数据库的连接（每个时间段）

休眠检查线程中与数据库的连接（每个时间段）

其他 2022-01-01 919
如何检查用户是否首次打开我的应用（Flutter应用，飞镖代码）

如何检查用户是否首次打开我的应用（Flutter应用，飞镖代码）

其他 2022-01-01 839
PHP检查文件是否为图像

PHP检查文件是否为图像

php 2022-01-01 751

检查PDF文件在Python中是否有效

撰写回答

推荐问题

检查所有数组项是否为空PHP

如何使用PHP检查目录是否为空？

检查网站是否在iframe中

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

如何检查存储在变量中的给定文件描述符是否仍然有效？

如何检查是否使用Javascript加载了外部（跨域）CSS文件

如何检查HTML页面中是否加载了嵌入式SVG文档？

React是否总是检查整个树？

如何在使用@ConditionalOnProperty或@ConditionalOnExpression时检查两个条件

通过预处理检查O（1）中是否有2个树节点相关（祖先/后代）

检查元素上是否存在事件

Hibernate：检查对象是否存在

如何编写算法来检查数组/列表中任何两个数字的和是否与给定数字匹配？

JavaScript / jQuery检查断开的链接

检查字符串是否包含数组中的单词

如何检查PHP数组是关联数组还是顺序数组？

使用Java检查变量是否在两个数字之间

休眠检查线程中与数据库的连接（每个时间段）

如何检查用户是否首次打开我的应用（Flutter应用，飞镖代码）

PHP检查文件是否为图像

分类汇总

您的鼓励是对我最大的支持