我想在Windows XP上配置控制台以支持UTF8
我认为这不会发生。
65001代码页有错误;一些stdio调用行为不正确并破坏了许多工具。您可以手动将cp65001注册为编码:
def cp65001(name):
if name.lower()=='cp65001':
return codecs.lookup('utf-8')
codecs.register(cp65001)
并且允许您print u'some unicode string'
这样做,不允许您在该Unicode字符串中写入非ASCII字符。您会遇到与尝试将非ASCII UTF-8序列直接作为字节字符串直接写入时相同的奇数错误(IOError 0等)。
不幸的是,UTF-8是Windows下的二等公民。NT的Unicode模型是在UTF-8出现之前制定的,因此,您希望在需要一致Unicode的任何地方使用每代码单元两个字节的编码(UTF-16,最初为UCS-2)。与许多使用C编写的便携式应用程序和语言(例如Python)一样,使用字节字符串stdio
不适合该模型。
而且,重写Python以使用Windows Unicode控制台调用(例如WriteConsoleW)而不是可移植的C stdio调用,不能很好地与管道和重定向到文件之类的shell技巧一起使用。(更不用说,您仍然必须从默认终端字体更改为TTF字体,然后才能看到所有结果……)
最终,如果您需要一个命令行以及对基于stdio的应用程序具有有效的UTF-8支持的命令行,则最好使用故意支持Windows的Windows控制台替代品,例如Cygwin,Python的IDLE或pywin32的PythonWin。