U + 2466是CIRCLED DIGIT SEVEN(⑦),所以是的,它是一个数字。
如果您对数字的定义与Unicode联合会的定义不同,则可能必须编写自己的isdigit()
方法。
编辑,如果我不想将其视为数字,那么如何将其过滤掉?
如果您只对ASCII数字0
…感兴趣,则9
可以执行以下操作:
In [4]: s = u'abc 12434 \u2466 5 def'
In [5]: u''.join(c for c in s if '0' <= c <= '9')
Out[5]: u'124345'