简短的答案是否定的,因为分页符是由呈现引擎插入的,而不是由.docx文件本身确定的。
但是,某些客户端<w:lastRenderedPageBreak>
在保存的XML中放置一个元素,以指示他们在上次呈现页面时中断了页面。
我不知道这样做是什么(尽管我希望Word本身可以做到)以及它的可靠性如何,但是如果您想在Python中工作,这就是我建议的方向。您可能会使用python- docx来获取所需的lxml元素的引用(如w:document/w:body
),然后使用XPath命令或其他内容来迭代到特定页面,但只是想一想,这将是一个详细的开发过程使它工作。
如果您使用本地Windows MS Office API,则可能会得到更好的效果,因为它实际上运行Word应用程序。
如果您是在python- docx中生成文档,则不会放置这些元素,因为它不会尝试呈现文档(也不可能)。我们也不太可能在短期内增加对w:lastRenderedPageBreak的支持;我什至不确定那会是什么样子。
如果您搜索“ lastRenderedPageBreak”和/或“ python-docx分页符”,则会在此处看到其他问题/答案,可能还会提供更多信息。