您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

将包含ASCII的字符串转换为Unicode

将包含ASCII的字符串转换为Unicode

没有ASCII显示中文字符的代码。ASCII不代表汉字。

如果您已经有一个Java字符串,则它已经具有所有字符(美国,拉丁语,中文)的内部表示形式。然后,您可以使用UTF-8UTF-16表示形式将该Java字符串 为Unicode :

String s =“可以告诉我”; ( : 在没有汉字字体的系统上该行无法正确显示

String s = "\u53ef\u4ee5\u544a\u8bc9\u6211";
byte utfString = s.getBytes("UTF-8");

现在,我查看了您的更新问题,您可能正在寻找StringEscapeUtils类。它来自Apache Commons Text。并且会将您的HTML实体 为Java字符串:

String s = StringEscapeUtils.unescapeHtml("& #21487;& #20197;& #21578;& #35785;& #25105;"); // without spaces
其他 2022/1/1 18:32:17 有514人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶