您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

从Wikipedia文章(Python)中提取第一段

从Wikipedia文章(Python)中提取第一段

前一段时间,我为获取纯文本的Wikipedia文章制作了两个类。我知道它们不是最佳解决方案,但是您可以根据需要进行调整:@H_502_1@

wikipedia.py wiki2plain.py@H_502_1@

您可以像这样使用它:@H_502_1@

from wikipedia import Wikipedia
from wiki2plain import Wiki2Plain

lang = 'simple'
wiki = Wikipedia(lang)

try:
    raw = wiki.article('Uruguay')
except:
    raw = None

if raw:
    wiki2plain = Wiki2Plain(raw)
    content = wiki2plain.text
python 2022/1/1 18:48:11 有346人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶