您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

为什么用lxml处理XHTML文档(在python中)时xpath无法正常工作?

为什么用lxml处理XHTML文档(在python中)时xpath无法正常工作?

问题是名称空间。当解析为XML时,img标记位于http://www.w3.org/1999/xhtml命名空间中,因为这是该元素的认命名空间。您在没有名称间的情况下要求img标记

尝试这个:

>>> tree.getroot().xpath(
...     "//xhtml:img", 
...     namespaces={'xhtml':'http://www.w3.org/1999/xhtml'}
...     )
[<Element {http://www.w3.org/1999/xhtml}img at 11a29e0>]
python 2022/1/1 18:33:09 有498人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶