nltk中使用的Wordnet不支持阿拉伯语。如果您正在寻找阿拉伯语Wordnet,那么这是完全不同的事情。
对于阿拉伯语词网,请下载:
您使用以下命令运行它:
$ python AWNDatabaseManagement.py -i upc_db.xml
现在得到类似的东西wn.synset('??????')
。阿拉伯语Wordnet具有功能wn.get_synsets_from_word(word)
,但提供了偏移量。它也只接受数据库中发声的单词。例如,你应该使用??????
的????
:
>> wn.get_synsets_from_word(u"??????")
[(u'a', u'300218842')]
300218842
是????的同义词集的偏移量。
我检查了单词??????,看来它在AWN中不存在。