根据文档,首先创建一个分析树:
import BeautifulSoup
html = "<html><body><tr><td><a href='foo'/></td></tr></body></html>"
soup = BeautifulSoup.BeautifulSoup(html)
然后在其中进行搜索,例如搜索<a>
其直接父级是的标签<td>
:
for ana in soup.findAll('a'):
if ana.parent.name == 'td':
print ana["href"]