概述
def split_utf8(s,n): """Split UTF-8 s into chunks of maximum length n.""" while len(s) > n: k = n while (ord(s[k]) & 0xc0) == 0x80: k -= 1 yield s[:k] s = s[k:] yield s
没有测试.但是你找到一个分割的地方,然后回溯到你到达一个角色的开头.
但是,如果用户可能希望看到一个单独的块,则可能需要拆分图形集群边界.这显然更复杂,但不是棘手的.例如,在“é”中,您可能不想拆分“e”和“”“.或者你可能不在乎,只要他们再次陷入僵局.
总结
以上是编程之家为你收集整理的python – 将unicode字符串拆分成300字节的块,而不会破坏字符全部内容,希望文章能够帮你解决python – 将unicode字符串拆分成300字节的块,而不会破坏字符所遇到的程序开发问题。
如果您也喜欢它,动动您的小指点个赞吧