您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

使用通用编码检测器(chardet)在Python中的文本文件中进行字符检测

使用通用编码检测器(chardet)在Python中的文本文件中进行字符检测

chardet.detect()返回一个字典,该字典提供编码作为与键关联的值'encoding'。因此,您可以执行以下操作:

import chardet    
rawdata = open(infile, 'rb').read()
result = chardet.detect(rawdata)
charenc = result['encoding']

chardet文档并未明确说明是否应将文本字符串和/或字节字符串与该模块一起使用,但是它的理由是,如果您有文本字符串,则不需要对其进行字符检测,因此您应该可能正在传递字节字符串。因此b,对的调用中的二进制模式标志()open()。但是chardet.detect()也可以根据文本字符串来使用,具体取决于您所使用的Python版本和所用的库版本,即,如果您确实忽略了b它,那么即使您在技术上做错了事情,也可能会发现它仍然可以工作。

python 2022/1/1 18:30:14 有184人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶