如何使用python解码代表utf-8的字符串？

如果您打印了字符串的repr()输出，unicode那么您似乎有一个 Mojibake ，使用错误的编码对字节数据进行了解码。

首先编码回字节，然后使用正确的编解码器解码。这可能像编码Latin-1一样简单：

unicode_string.encode('latin1').decode('utf8')

但是，这取决于如何应用错误的解码。如果使用Windows代码页（如CP1252），则无论如何强制对CP1252范围之外的UTF-8字节进行编码，最终可能会得到实际上无法编码回CP1252的Unicode数据。

修复此类错误的最佳方法是使用ftfy库，该库知道如何处理各种编解码器的强制解码的Mojibake文本。

对于您的小样本，Latin-1 似乎可以正常工作：

>>> unicode_string = u'\xE5\xB1\xB1\xE4\xB8\x9C \xE6\x97\xA5\xE7\x85\xA7'
>>> print unicode_string.encode('latin1').decode('utf8')
山东 日照
>>> import ftfy
>>> print ftfy.fix_text(unicode_string)
山东 日照

如果您有文字字符\，x后跟两位数字，那么您将拥有另一层编码层，其中字节被4个字符替换。您必须先要求Python使用string_escape编解码器解释转义，然后才能将其“解码”为实际字节：

>>> unicode_string = ur'\xE5\xB1\xB1\xE4\xB8\x9C \xE6\x97\xA5\xE7\x85\xA7'
>>> unicode_string
u'\\xE5\\xB1\\xB1\\xE4\\xB8\\x9C \\xE6\\x97\\xA5\\xE7\\x85\\xA7'
>>> print unicode_string.decode('string_escape').decode('utf8')
山东 日照

'string_escape'是一个Python 2唯一的编解码器，它产生一个字节串，因此以后将其解码为UTF-8是安全的。

python 2022/1/1 18:31:08 有495人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何通过忽略Swift中的关联值来比较枚举和关联值？

如何通过忽略Swift中的关联值来比较枚举和关联值？

Swift 2022-01-01 1129
如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

其他 2022-01-01 1392
如何在JavaScript中将浮点数转换为整数？

如何在JavaScript中将浮点数转换为整数？

javascript 2022-01-01 1270
如何基于EXPLAIN计划优化MySQL查询

如何基于EXPLAIN计划优化MySQL查询

MySQL 2022-01-01 1253
如何在C＃/。NET中查找本地计算机的FQDN？

如何在C＃/。NET中查找本地计算机的FQDN？

c# 2022-01-01 1109
如何在Spring MVC中使用AJAX渲染视图

如何在Spring MVC中使用AJAX渲染视图

Java 2022-01-01 1248
如何在PHP变量中去除空格？

如何在PHP变量中去除空格？

php 2022-01-01 1177
如何枚举JavaScript对象的属性？

如何枚举JavaScript对象的属性？

javascript 2022-01-01 1225
如何立即关闭Node.js HTTP服务器？

如何立即关闭Node.js HTTP服务器？

Node 2022-01-01 1140
如何在IE8和9中支持占位符属性

如何在IE8和9中支持占位符属性

其他 2022-01-01 1161
如何使用jQuery访问父窗口对象？

如何使用jQuery访问父窗口对象？

JS 2022-01-01 1181
如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

其他 2022-01-01 1241
如何使用CSS将跨度更改为类似pre？

如何使用CSS将跨度更改为类似pre？

CSS 2022-01-01 1218
如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

其他 2022-01-01 1229
如何使用C＃获取两个DateTime对象之间的时差？

如何使用C＃获取两个DateTime对象之间的时差？

c# 2022-01-01 1192
Django-如何使用South重命名模型字段？

Django-如何使用South重命名模型字段？

Go 2022-01-01 1437
如何计算回溯算法的时间复杂度？

如何计算回溯算法的时间复杂度？

其他 2022-01-01 1226
如何在.htaccess中隐藏.php扩展名

如何在.htaccess中隐藏.php扩展名

php 2022-01-01 1261
使用GhostDriver时如何设置屏幕/窗口大小

使用GhostDriver时如何设置屏幕/窗口大小

其他 2022-01-01 1304
如何在html5中制作透明画布？

如何在html5中制作透明画布？

其他 2022-01-01 1191

如何使用python解码代表utf-8的字符串？

撰写回答

推荐问题

如何通过忽略Swift中的关联值来比较枚举和关联值？

如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

如何在JavaScript中将浮点数转换为整数？

如何基于EXPLAIN计划优化MySQL查询

如何在C＃/。NET中查找本地计算机的FQDN？

如何在Spring MVC中使用AJAX渲染视图

如何在PHP变量中去除空格？

如何枚举JavaScript对象的属性？

如何立即关闭Node.js HTTP服务器？

如何在IE8和9中支持占位符属性

如何使用jQuery访问父窗口对象？

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

如何使用CSS将跨度更改为类似pre？

如何在Express中模拟中间件以跳过身份验证以进行单元测试？

如何使用C＃获取两个DateTime对象之间的时差？

Django-如何使用South重命名模型字段？

如何计算回溯算法的时间复杂度？

如何在.htaccess中隐藏.php扩展名

使用GhostDriver时如何设置屏幕/窗口大小

如何在html5中制作透明画布？

分类汇总

您的鼓励是对我最大的支持