我在Askbot问答论坛上采用了一个名为unidecode的python软件包,它适用于基于拉丁语的字母,甚至对希腊人来说也很合理:
>>> import unidecode
>>> from unidecode import unidecode
>>> unidecode(u'διακριτικ??')
'diakritikos'
它对亚洲语言有些奇怪:
>>> unidecode(u'影師嗎')
'Ying Shi Ma '
>>>
这有意义吗?
在askbot中,我们按如下方式计算段塞:
from unidecode import unidecode
from django.template import defaultfilters
slug = defaultfilters.slugify(unidecode(input_text))