您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python urlparse —提取不带子域的域名

Python urlparse —提取不带子域的域名

您可能想查看tldextract,该库旨在执行这种操作。

它使用公共后缀列表尝试根据已知gTLD进行合理的拆分,但请注意,这只是一个蛮力列表,没有什么特别的,因此可以过时了(尽管希望它经过整理以免)。

>>> import tldextract
>>> tldextract.extract('http://forums.news.cnn.com/')
ExtractResult(subdomain='forums.news', domain='cnn', suffix='com')

因此,在您的情况下:

>>> extracted = tldextract.extract('http://www.google.com')
>>> "{}.{}".format(extracted.domain, extracted.suffix)
"google.com"
python 2022/1/1 18:34:26 有334人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶