概述
我想在Python中读取包含阿拉伯文本的JSON文件,但阿拉伯文本显示如下:
?§???³???¹???§?¯???©?? ?????????³?????? ?§??????µ?????????? ?¹?????‰??
?…?§?? ???§?????…???????? ?¨???? ???????? ?£???? ???????????…??
?????????¯?±?????? ?????????…?©?? ?…???§?????…????
我怎样才能读出正确的阿拉伯字母?
import sys
non_bmp_map = dict.fromkeys(range(0x10000,sys.maxunicode + 1),0xfffd)
print(x.translate(non_bmp_map))
x是包含来自JSON文件的阿拉伯值的参数.
我期待得到这句话:但是我得到了?§?“??????¹???§?¯???©???”???????³??????????“????μ??”???¹???“?‰???but???? …?§???“????????????????????????????????????????????£££?????????±±±±±±±±±…..?±± ???§?????…?“??
如果您使用Python 2,请使用编解码器:
import codecs
f = codecs.open('unicode.rst',encoding='utf-8')
for line in f:
print repr(line)
但是,您的输入数据可能未正确编码.在这种情况下,您可以尝试使用ftfy
package.
ftfy实现了几种启发式方法来修复破坏/不一致的unicode编码.来自文档:
>>> from ftfy import fix_encoding
>>> print(fix_encoding("(�'�')�"))
(?'?')?
总结
以上是编程之家为你收集整理的从JSON文件中读取阿拉伯语全部内容,希望文章能够帮你解决从JSON文件中读取阿拉伯语所遇到的程序开发问题。
如果您也喜欢它,动动您的小指点个赞吧