为什么python2和python3中的print输出使用相同的字符串不同？

考虑以下代码片段：

import sys
for i in range(128, 256):
    sys.stdout.write(chr(i))

使用Python 2运行此命令，然后使用以下命令查看结果hexdump -C：

00000000  80 81 82 83 84 85 86 87  88 89 8a 8b 8c 8d 8e 8f  |................|

等等。不出意外；从0x80到128个字节0xff。

对Python 3做同样的事情：

00000000  c2 80 c2 81 c2 82 c2 83  c2 84 c2 85 c2 86 c2 87  |................|
...
00000070  c2 b8 c2 b9 c2 ba c2 bb  c2 bc c2 bd c2 be c2 bf  |................|
00000080  c3 80 c3 81 c3 82 c3 83  c3 84 c3 85 c3 86 c3 87  |................|
...
000000f0  c3 b8 c3 b9 c3 ba c3 bb  c3 bc c3 bd c3 be c3 bf  |................|

总结一下：

那么，这是怎么回事？

在Python 2中，字符串为ASCII，并且不进行任何转换。告诉它写在0-127 ASCII范围之外的内容，并说“ okey- doke！”。并只写那些字节。简单。

在Python 3中，字符串是 Unicode 。写入非ASCII字符时，必须以某种方式对它们进行编码。默认编码为UTF-8。

那么，这些值如何用UTF-8编码？

从0x80到的代码点0x7ff编码如下：

110vvvvv 10vvvvvv

其中11个v字符是代码点的位。

从而：

0x80                 hex
1000 0000            8-bit binary
000 1000 0000        11-bit binary
00010 000000         divide into vvvvv vvvvvv
11000010 10000000    resulting UTF-8 octets in binary
0xc2 0x80            resulting UTF-8 octets in hex

0xc0                 hex
1100 0000            8-bit binary
000 1100 0000        11-bit binary
00011 000000         divide into vvvvv vvvvvv
11000011 10000000    resulting UTF-8 octets in binary
0xc3 0x80            resulting UTF-8 octets in hex

因此，这就是为什么要获得c2以前的原因87。

如何在Python 3中避免所有这些？使用bytes类型。

python 2022/1/1 18:39:45 有276人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

php 2022-01-01 1097
为什么需要将匿名函数传递给onClick事件？

为什么需要将匿名函数传递给onClick事件？

其他 2022-01-01 1091
为什么Class.newInstance（）是“evil”？

为什么Class.newInstance（）是“evil”？

其他 2022-01-01 1029
在为该对象分配其他内容时，为什么不通过引用传递该对象？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

其他 2022-01-01 1318
为什么我们将firefoxdriver实例分配给webdriver

为什么我们将firefoxdriver实例分配给webdriver

其他 2022-01-01 1019
为什么新的Java 8日期时间API不具有纳秒精度？

为什么新的Java 8日期时间API不具有纳秒精度？

java 2022-01-01 1044
为什么浮点数打印方式如此不同？

为什么浮点数打印方式如此不同？

其他 2022-01-01 1033
为什么说深度优先搜索会遭受无限循环的困扰？

为什么说深度优先搜索会遭受无限循环的困扰？

其他 2022-01-01 933
为什么找不到SSL握手的信任库？

为什么找不到SSL握手的信任库？

其他 2022-01-01 1037
为什么没有输入，民意调查仍会返回？

为什么没有输入，民意调查仍会返回？

其他 2022-01-01 941
为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

其他 2022-01-01 935
在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

其他 2022-01-01 1046
为什么Hibernate切换为通过CLOB使用LONG？

为什么Hibernate切换为通过CLOB使用LONG？

其他 2022-01-01 982
为什么“无”映像出现在Docker中以及我们如何避免它

为什么“无”映像出现在Docker中以及我们如何避免它

其他 2022-01-01 910
为什么在pom.xml的第1行中出现Unknown错误？

为什么在pom.xml的第1行中出现Unknown错误？

其他 2022-01-01 1232
为什么数据传输对象（DTO）是反模式？

为什么数据传输对象（DTO）是反模式？

其他 2022-01-01 908
为什么某些技术上可序列化的输入属性不能序列化？

为什么某些技术上可序列化的输入属性不能序列化？

其他 2022-01-01 984
什么是仓库和标签？为什么在使用docker build时它们会出现？

什么是仓库和标签？为什么在使用docker build时它们会出现？

其他 2022-01-01 1017
为什么无法在Java中扩展注释？

为什么无法在Java中扩展注释？

java 2022-01-01 1101
Java Map为什么不扩展Collection？

Java Map为什么不扩展Collection？

java 2022-01-01 987

为什么python2和python3中的print输出使用相同的字符串不同？

撰写回答

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

为什么需要将匿名函数传递给onClick事件？

为什么Class.newInstance（）是“evil”？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

为什么我们将firefoxdriver实例分配给webdriver

为什么新的Java 8日期时间API不具有纳秒精度？

为什么浮点数打印方式如此不同？

为什么说深度优先搜索会遭受无限循环的困扰？

为什么找不到SSL握手的信任库？

为什么没有输入，民意调查仍会返回？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

为什么Hibernate切换为通过CLOB使用LONG？

为什么“无”映像出现在Docker中以及我们如何避免它

为什么在pom.xml的第1行中出现Unknown错误？

为什么数据传输对象（DTO）是反模式？

为什么某些技术上可序列化的输入属性不能序列化？

什么是仓库和标签？为什么在使用docker build时它们会出现？

为什么无法在Java中扩展注释？

Java Map为什么不扩展Collection？

分类汇总

您的鼓励是对我最大的支持