如果您已经有一个Java字符串,则它已经具有所有字符(美国,拉丁语,中文)的内部表示形式。然后,您可以使用UTF-8或UTF-16表示形式将该Java字符串 为Unicode :
String s =“可以告诉我”;
( : 在没有汉字字体的系统上该行无法正确显示 )
String s = "\u53ef\u4ee5\u544a\u8bc9\u6211";
byte utfString = s.getBytes("UTF-8");
现在,我查看了您的更新问题,您可能正在寻找StringEscapeUtils类。它来自Apache Commons Text。并且会将您的HTML实体 为Java字符串:
String s = StringEscapeUtils.unescapeHtml("& #21487;& #20197;& #21578;& #35785;& #25105;"); // without spaces