我想这就是你想要的。它不是UTF-8字节字符串(从技术上讲是这样,但这仅是因为ASCII是UTF-8的子集)。
>>> s='\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5'
>>> print s.decode('unicode-escape')
欢迎提交微博搜索使用反馈,请直接
仅供参考,这是UTF-8:
>>> s.decode('unicode-escape').encode('utf8')
’\ xe6 \ xac \ xa2 \ xe8 \ xbf \ x8e \ xe6 \ x8f \ x90 \ xe4 \ xba \ xa4 \ xe5 \ xbe \ xae \ xae \ xe5 \ x8d \ x9a \ xe6 \ x90 \ x90 \ x9c \ xe7 \ xb4 \ xa2 \ xe4 \ xbd \ xbf \ xe7 \ x94 \ xa8 \ xe5 \ x8f \ x8d \ xe9 \ xa6 \ x88 \ xef \ xbc \ x8c \ xe8 \ xaf \ xb7 \ xe7 \ x9b \ xb4 \ xe6 \ x8e \ xa5’