Python提取网页中超链接的方法

5b51 2022/1/14 8:18:47 python 字数 1455 阅读 379 来源 www.jb51.cc/python

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

概述

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"',doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容，希望本文的内容对大家的学习或者工作能有所帮助，如果有疑问大家可以留言交流。

总结

以上是编程之家为你收集整理的Python提取网页中超链接的方法全部内容，希望文章能够帮你解决Python提取网页中超链接的方法所遇到的程序开发问题。

如果您也喜欢它,动动您的小指点个赞吧

除非注明，文章均由 laddyq.com 整理发布，欢迎转载。

转载请注明：
链接：http://laddyq.com
来源：laddyq.com
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Python提取网页中超链接的方法

概述

总结

分类汇总

您的鼓励是对我最大的支持