概述
需要先安装requests库和bs4库
<span style="color: #008000">#<span style="color: #008000">目标网页
url = <span style="color: #800000">'<span style="color: #800000">https://www.cnblogs.com/huwt/<span style="color: #800000">'<span style="color: #000000">
demo =<span style="color: #000000"> getHTMLText(url)
<span style="color: #008000">#<span style="color: #008000">解析HTML代码
soup = BeautifulSoup(demo,<span style="color: #800000">'<span style="color: #800000">html.parser<span style="color: #800000">'<span style="color: #000000">)
<span style="color: #008000">#<span style="color: #008000">模糊搜索HTML代码的所有标签
a_labels = soup.find_all(<span style="color: #800000">'<span style="color: #800000">a<span style="color: #800000">'<span style="color: #000000">)
<span style="color: #008000">#<span style="color: #008000">获取所有标签中的href对应的值,即超链接
<span style="color: #0000ff">for a <span style="color: #0000ff">in<span style="color: #000000"> a_labels:
<span style="color: #0000ff">print(a.get(<span style="color: #800000">'<span style="color: #800000">href<span style="color: #800000">'))
总结
以上是编程之家为你收集整理的python爬虫入门---第一篇:获取某一网站所有超链接全部内容,希望文章能够帮你解决python爬虫入门---第一篇:获取某一网站所有超链接所遇到的程序开发问题。
如果您也喜欢它,动动您的小指点个赞吧