从python中的字符串中删除控制字符

Unicode中有 数百个 控制字符。如果您要清理来自Web或其他可能包含非ASCII字符的其他来源的数据，则需要Python的unicodedata模块。该unicodedata.category(…)函数返回任何字符的unicode类别代码（例如，控制字符，空格，字母等）。对于控制字符，类别始终以“ C”开头。

此代码段从字符串中删除所有控制字符。

import unicodedata
def remove_control_characters(s):
    return "".join(ch for ch in s if unicodedata.category(ch)[0]!="C")

unicode类别的示例：

>>> from unicodedata import category
>>> category('\r')      # carriage return --> Cc : control character
'Cc'
>>> category('\0')      # null character ---> Cc : control character
'Cc'
>>> category('\t')      # tab --------------> Cc : control character
'Cc'
>>> category(' ')       # space ------------> Zs : separator, space
'Zs'
>>> category(u'\u200A') # hair space -------> Zs : separator, space
'Zs'
>>> category(u'\u200b') # zero width space -> Cf : control character, formatting
'Cf'
>>> category('A')       # letter "A" -------> Lu : letter, uppercase
'Lu'
>>> category(u'\u4e21') # 両 ---------------> Lo : letter, other
'Lo'
>>> category(',')       # comma  -----------> Po : punctuation
'Po'
>>>

python 2022/1/1 18:25:25 有163人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

从Python访问errno？

从Python访问errno？

python 2022-01-01 1059
从Python字符串中删除不在允许列表中的HTML标签

从Python字符串中删除不在允许列表中的HTML标签

python 2022-01-01 1085
从python读取json文件

从python读取json文件

python 2022-01-01 972
为什么从Promise`.then`中进行回调是一种反模式

为什么从Promise`.then`中进行回调是一种反模式

其他 2022-01-01 829
从PostgreSQL数据库到Elasticsearch snyc /导入表的正确方法是什么？

从PostgreSQL数据库到Elasticsearch snyc /导入表的正确方法是什么？

SQLServer 2022-01-01 950
自动从PHP代码中删除注释的最佳方法

自动从PHP代码中删除注释的最佳方法

php 2022-01-01 830
为什么从PHP 5.4开始永久启用“ echo”短标签？

为什么从PHP 5.4开始永久启用“ echo”短标签？

php 2022-01-01 873
如何将变量和数据从PHP传递到JavaScript？

如何将变量和数据从PHP传递到JavaScript？

php 2022-01-01 741
如何从PHP中的XML文件获取属性的值？

如何从PHP中的XML文件获取属性的值？

php 2022-01-01 748
如何从Perl CGI程序发送JSON响应？

如何从Perl CGI程序发送JSON响应？

其他 2022-01-01 800
如何从PHP文本中删除空白行？

如何从PHP文本中删除空白行？

php 2022-01-01 821
从POST获取复选框数组值

从POST获取复选框数组值

其他 2022-01-01 815
从print_r输出重新创建原始PHP数组

从print_r输出重新创建原始PHP数组

php 2022-01-01 824
尝试使用Spring Boot REST从POST读取JSON字符串

尝试使用Spring Boot REST从POST读取JSON字符串

Java 2022-01-01 828
如何从Postman Rest Client发送Spring CSRF令牌？

如何从Postman Rest Client发送Spring CSRF令牌？

Java 2022-01-01 804
LOAD DATA LOCAL INFILE失败-从php到mysql（在Amazon rds上）

LOAD DATA LOCAL INFILE失败-从php到mysql（在Amazon rds上）

php 2022-01-01 883
从PHP运行返回错误。AJAX？

从PHP运行返回错误。AJAX？

php 2022-01-01 790
如何从python mysql查询中转义％

如何从python mysql查询中转义％

MySQL 2022-01-01 796
从PHP中的小数中删除无用的零数字

从PHP中的小数中删除无用的零数字

php 2022-01-01 846
如何从PHP脚本发送500 Internal Server Error错误

如何从PHP脚本发送500 Internal Server Error错误

php 2022-01-01 614

从python中的字符串中删除控制字符

撰写回答

推荐问题

从Python访问errno？

从Python字符串中删除不在允许列表中的HTML标签

从python读取json文件

为什么从Promise`.then`中进行回调是一种反模式

从PostgreSQL数据库到Elasticsearch snyc /导入表的正确方法是什么？

自动从PHP代码中删除注释的最佳方法

为什么从PHP 5.4开始永久启用“ echo”短标签？

如何将变量和数据从PHP传递到JavaScript？

如何从PHP中的XML文件获取属性的值？

如何从Perl CGI程序发送JSON响应？

如何从PHP文本中删除空白行？

从POST获取复选框数组值

从print_r输出重新创建原始PHP数组

尝试使用Spring Boot REST从POST读取JSON字符串

如何从Postman Rest Client发送Spring CSRF令牌？

LOAD DATA LOCAL INFILE失败-从php到mysql（在Amazon rds上）

从PHP运行返回错误。AJAX？

如何从python mysql查询中转义％

从PHP中的小数中删除无用的零数字

如何从PHP脚本发送500 Internal Server Error错误

分类汇总

您的鼓励是对我最大的支持