实际上,这是无效的UTF-8。在UTF-8中,只能使用两个字节对U + 0080到U + 07FF(含)范围内的代码点进行编码。仔细阅读Wikipedia文章,您将看到相同的内容。结果,该字节0xc0
可能永远不会出现在UTF-8中。的情况也是如此0xc1
。
一些UTF-8解码器具有错误的解码序列,例如C0 AF
有效的UTF-8,这在过去已导致安全漏洞。
python:UnicodeDecodeError:'utf8'编解码器无法解码位置0的字节0xc0:无效的起始字节
实际上,这是无效的UTF-8。在UTF-8中,只能使用两个字节对U + 0080到U + 07FF(含)范围内的代码点进行编码。仔细阅读Wikipedia文章,您将看到相同的内容。结果,该字节0xc0
可能永远不会出现在UTF-8中。的情况也是如此0xc1
。
一些UTF-8解码器具有错误的解码序列,例如C0 AF
有效的UTF-8,这在过去已导致安全漏洞。