您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

python中具有unicode数据的string.translate()

python中具有unicode数据的string.translate()

在Unicode对象上,translate方法的工作方式不同于在字节字符串对象上:

>>>帮助(unicode.translate)

S.translate(table)-> unicode

返回字符串S的副本,其中所有字符均已映射
通过给定的转换表,该表必须是
从Unicode序号到Unicode序号,Unicode字符串或无。
未映射的字符保持不变。字符映射为无
被删除

因此,您的示例将变为:

remove_punctuation_map = dict((ord(char), None) for char in string.punctuation)
word_list = [s.translate(remove_punctuation_map) for s in value_list]

但是请注意,string.punctuation仅包含ASCII标点符号。完全Unicode具有更多的标点符号字符,但这全部取决于您的用例。

python 2022/1/1 18:27:50 有190人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶