您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手

5b51 2022/1/14 8:24:40 python 字数 2143 阅读 672 来源 www.jb51.cc/python

importxml.etree.ElementTreeasET importpandasaspd importnumpyasnp tree=ET.parse(\'words.xml\') root=tree.getroot()

概述

要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手

import xml.etree.ElementTree as ET
import pandas as pd
import numpy as np
tree = ET.parse('words.xml')
root = tree.getroot()
words = pd.DataFrame(columns = ['word','trans','phonetic'])
for item in root:
 df = pd.DataFrame({'word': item[0].text,'trans': item[1].text,'phonetic': item[2].text},index = item)
 print(df)
 words = pd.concat([words,df],ignore_index = True)
 words = words.drop_duplicates()
words.to_excel('words1.xlsx',sheet_name = '1')

要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手

进群:548377875    即可获取小编精心准备的资料全套呢!

在这里面有两个问题目前没有看懂,一个

words = words.drop_duplicates()

,为什么要用这个,应为不用他的话每个单词会打印5遍,没办法,我就把重复项去掉了,我也不知道为什么会打印5遍。另外一个就是在sublime text 3中写

words.to_excel('words1.xlsx',sheet_name = '1')

的时候,会出现

UnicodeEncodeError: 'gbk' codec can't encode character '\u028c' in position 134: illegal multibyte sequence

可能是因为,‘gbk’搞不定音标吧,我猜的啊,不知道怎么解决,反正我在jupyter notebook中跑出来了。

是不是非常简单!赶紧用起来吧~!

总结

以上是编程之家为你收集整理的要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手全部内容,希望文章能够帮你解决要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手所遇到的程序开发问题。


如果您也喜欢它,动动您的小指点个赞吧

除非注明,文章均由 laddyq.com 整理发布,欢迎转载。

转载请注明:
链接:http://laddyq.com
来源:laddyq.com
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


联系我
置顶