您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Pythonpands 替换特殊字符

Pythonpands 替换特殊字符

我假设您在这里使用Python 2.x,这可能是Unicode问题。不用担心,您并不孤单-unicode通常非常困难,尤其是在Python 2中,这就是为什么它在Python 3中成为标准的原因。

如果您只关心ñ,则应使用UTF-8解码,然后仅替换一个字符。

看起来类似于以下内容

DF['name'] = DF['name'].str.decode('utf-8').replace(u'\xf1', 'n')

举个例子:

>>> "sureño".decode("utf-8").replace(u"\xf1", "n")
u'sureno'

如果您的字符串已经是Unicode,则可以(实际上必须)跳过该decode步骤:

>>> u"sureño".replace(u"\xf1", "n")
u'sureno'

请注意,此处u’\xf1’将十六进制转义用于所讨论的字符。

更新资料 我在评论中被告知<>.str.replace是熊猫系列方法,但我没有意识到。对此的答案可能类似于以下内容

DF['name'] = map(lambda x: x.decode('utf-8').replace(u'\xf1', 'n'), DF['name'].str)

或类似的东西(如果该熊猫对象是可迭代的)。

一个更新 实际上,我刚想到您的问题可能很简单,如下所示:

DF['NAME']=DF['NAME'].str.replace(u"ñ","n")

请注意,我是如何u在字符串前面添加使其成为unicode的。

python 2022/1/1 18:31:22 有198人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶