Unicode在Python内部如何表示？

我假设您想了解cpython（标准实现）。Python 2和Python 3.0-3.2对Unicode字符使用UCS2 *或UCS4，这意味着每个字符 将使用2个字节或4个字节。选择哪个是编译时选项。

\u2049然后根据您系统的本机字节顺序以及是否选择了UCS2或UCS4将其表示为\x49\x20or\x20\x49或\x49\x20\x00\x00or\x00\x00\x20\x49或or。Unicode字符串中的ASCII字符仍然每个字符使用2或4个字节。

Python 3.3使用表示字符串中所有字符所需的最紧凑形式，切换到新的内部表示形式。选择1个字节，2个字节或4个字节。ASCII和Latin-1文本每个字符仅使用1个字节，其余BMP字符需要2个字节，之后使用4个字节。

有关这些表示形式的完整介绍，请参阅PEP-393：灵活字符串表示 形式。

*从技术上讲，UCS-2构建使用UTF-16，因为非BMP字符使用UTF-16替代每个编码为4个字节（2个UTF-16字符）。但是，Python文档仍然将此称为UCS2。

这的确会导致意外行为，例如len()非BMP Unicode字符串上的字符长于所包含的字符数。

python 2022/1/1 18:43:07 有291人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

ESLint-组件应被编写为纯函数（react preferred / stateless function）

ESLint-组件应被编写为纯函数（react preferred / stateless function）

其他 2022-01-01 1153
带有React的ESLint会给出“ no-unused-vars”错误

带有React的ESLint会给出“ no-unused-vars”错误

其他 2022-01-01 1190
使用Spring Functional Web Framework的REST端点的背压

使用Spring Functional Web Framework的REST端点的背压

Java 2022-01-01 1245
无法在Ubuntu上将ElasticSearch作为服务运行

无法在Ubuntu上将ElasticSearch作为服务运行

其他 2022-01-01 973
手册页中Unix命令名称后的括号中的数字是什么意思？

手册页中Unix命令名称后的括号中的数字是什么意思？

其他 2022-01-01 1116
java.lang.NoClassDefFoundError：javax / persistence / SharedCacheMode

java.lang.NoClassDefFoundError：javax / persistence / SharedCacheMode

java 2022-01-01 1198
使用npm命令时SSL错误：CERT_UNTRUSTED

使用npm命令时SSL错误：CERT_UNTRUSTED

其他 2022-01-01 722
获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

java 2022-01-01 986
Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

Java 2022-01-01 989
iTunesConnect TestFlight的iOS应用版本和内部版本号

iTunesConnect TestFlight的iOS应用版本和内部版本号

其他 2022-01-01 1024
elasticsearch-Ubuntu-拒绝连接

elasticsearch-Ubuntu-拒绝连接

其他 2022-01-01 1011
为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

其他 2022-01-01 934
蚂蚁找不到Javac，JAVA_HOME不会在Ubuntu上设置

蚂蚁找不到Javac，JAVA_HOME不会在Ubuntu上设置

java 2022-01-01 1031
javax.net.ssl.SSLPeerUnverifiedException：使用JMeter进行负载测试时未对等身份验证

javax.net.ssl.SSLPeerUnverifiedException：使用JMeter进行负载测试时未对等身份验证

java 2022-01-01 883
没有基本的HTTP身份验证，如何强制MockitoJUnitRunner失败？

没有基本的HTTP身份验证，如何强制MockitoJUnitRunner失败？

其他 2022-01-01 1072
为什么在pom.xml的第1行中出现Unknown错误？

为什么在pom.xml的第1行中出现Unknown错误？

其他 2022-01-01 1231
无法使用Runtime.exec（）在Android Java代码中执行shell命令“ echo”

无法使用Runtime.exec（）在Android Java代码中执行shell命令“ echo”

java 2022-01-01 1085
$ .ajax（）和“ Uncaught ReferenceError：数据未定义”

$ .ajax（）和“ Uncaught ReferenceError：数据未定义”

其他 2022-01-01 853
LINQ与groupby和count

LINQ与groupby和count

其他 2022-01-01 845
如何通过Webkit如何在Ubuntu 11.04（Natty Narwhal）上运行Eclipse SWT Browser组件？

如何通过Webkit如何在Ubuntu 11.04（Natty Narwhal）上运行Eclipse SWT Browser组件？

其他 2022-01-01 1013

Unicode在Python内部如何表示？

撰写回答

推荐问题

ESLint-组件应被编写为纯函数（react preferred / stateless function）

带有React的ESLint会给出“ no-unused-vars”错误

使用Spring Functional Web Framework的REST端点的背压

无法在Ubuntu上将ElasticSearch作为服务运行

手册页中Unix命令名称后的括号中的数字是什么意思？

java.lang.NoClassDefFoundError：javax / persistence / SharedCacheMode

使用npm命令时SSL错误：CERT_UNTRUSTED

获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

iTunesConnect TestFlight的iOS应用版本和内部版本号

elasticsearch-Ubuntu-拒绝连接

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

蚂蚁找不到Javac，JAVA_HOME不会在Ubuntu上设置

javax.net.ssl.SSLPeerUnverifiedException：使用JMeter进行负载测试时未对等身份验证

没有基本的HTTP身份验证，如何强制MockitoJUnitRunner失败？

为什么在pom.xml的第1行中出现Unknown错误？

无法使用Runtime.exec（）在Android Java代码中执行shell命令“ echo”

$ .ajax（）和“ Uncaught ReferenceError：数据未定义”

LINQ与groupby和count

如何通过Webkit如何在Ubuntu 11.04（Natty Narwhal）上运行Eclipse SWT Browser组件？

分类汇总

您的鼓励是对我最大的支持