首页生活常识

汉字转unicode编码怎么用（中文转bytes，unicode转bytes java实现）

日期：2024-07-09 06:45:59 编辑:架构师笔记

字符串的编码格式：

String hex="\u5df2\u5b9e\u540d\u5236";// 十六进制

String dec = "全球通";//十进制

String s="已实名制";//字符串

相互转换的代码

1.十进制转unicode编码

public static String decToHex(String s){
 String[] ds=s.split(";");
 StringBuffer sbf=new StringBuffer();
 for(int i=0;i<ds.length;i++){
 if(ds[i].startsWith("")){
 Integer tem=Integer.parseInt(ds[i].replace("", ""));
 sbf.append("\\u").append(Integer.toHexString(tem)); 
 }
 
 }
 return sbf.toString();
}

2.unicode转char数组

/** 
 * unicode 转字符数组 
 */ 
public static char[] unicode2Chars(String unicode) { 
 
 StringBuffer string = new StringBuffer(); 
 
 String[] hex = unicode.split("\\\\u"); 
 
 char[] cs=new char[hex.length];
 
 for (int i = 1; i < hex.length; i++) { 
 
 // 转换出每一个代码点 
 int data = Integer.parseInt(hex[i], 16); 
 cs[i]=(char) data;
 } 
 
 return cs; 
}

3.汉字转unicode

/**
 * 
 * @param 汉字
 * @return unicode编码
 */
public static String toUnicode(String s) {
 String as[] = new String[s.length()];
 String s1 = "";
 for (int i = 0; i < s.length(); i++) {
 as[i] = Integer.toHexString(s.charAt(i) & 0xffff);
 s1 = s1 + "\\u" + as[i];
 }
 return s1;
}

utf-8

utf-8格式的中文由三位字节组成。

UTF-8的编码规则很简单，只有二条：

1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。

2）对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

下表总结了编码规则，字母x表示可用编码的位。

Unicode符号范围 | UTF-8编码方式

(十六进制) | （二进制）

--------------------+---------------------------------------------

0000 0000-0000 007F | 0xxxxxxx

0000 0080-0000 07FF | 110xxxxx 10xxxxxx

0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx

0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

1.中文转unicode

 public static String toUnicode(String s) {
 String as[] = new String[s.length()];
 String s1 = "";
 for (int i = 0; i < s.length(); i++) {
 as[i] = Integer.toHexString(s.charAt(i) & 0xffff);
 s1 = s1 + "\\u" + as[i];
 }
 return s1;
 }

2.中文转bytes

byte[] b=s.getBytes("utf-8");

3. unicode转utf-8

/*
 * unicode转到utf-8的转换过程。
 * @param 要进行转换的汉字
 * @return 16进制表示的汉字UTF-8编码字节序列 /
 */
 public static String unicode2utf8(char input){
 //1 Byte=8byte 16位取值范围00~ff
 //input 两个字节 16位取值范围为4E00~9FA5
 int lowByte = input & 0x00ff;
 int highByte = (input & 0xff00) >>> 8;
 // UTF-8的第1个字节是1110 + highByte高4位
 int high4inHighByte = (highByte& 0xf0) >>> 4;
 int utf8Byte1 = (7 << 5) + high4inHighByte;
 
 // UTF-8的第2个字节是10 + highByte低4位 + lowByte高2位
 int low4inHighByte = highByte & 0x0f;
 int high2inLowByte = (lowByte& 0xc0) >>> 6;
 int utf8Byte2 = (1 << 7) + (low4inHighByte << 2) + high2inLowByte;
 // UTF-8的第3个字节是10 + lowByte低6位
 int utf8Byte3 = (1 << 7) + (lowByte & 0x3f);
 String result = Integer.toHexString(utf8Byte1) + "," + Integer.toHexString(utf8Byte2) + ","
 + Integer.toHexString(utf8Byte3);
 return result;
 }

gbk

GBK编码，是对GB2312编码的扩展，因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案，其编码范围：8140－FEFE，剔除xx7F码位，共23940个码位。共收录汉字和图形符号21886个，其中汉字（包括部首和构件）21003个，图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字，并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布，这一版的GBK规范为1.0版。

GBK 亦采用双字节表示，总体编码范围为 8140-FEFE，首字节在 81-FE 之间，尾字节在 40-FE 之间，剔除 xx7F 一条线。总计 23940 个码位，共收入 21886 个汉字和图形符号，其中汉字（包括部首和构件）21003 个，图形符号 883 个。

全部编码分为三大部分：

1. 汉字区。包括：

a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个，按原顺序排列。

b. GB 13000.1 扩充汉字区。包括：

(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。

(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前，按 UCS 代码大小排列；增补的汉字（包括部首和构件）在后，按《康熙字典》的页码/字位排列。

(3) 汉字“〇”安排在图形符号区GBK/5：A996。

2. 图形符号区。包括：

a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外，还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。

b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“〇”排列在此区。计符号 166 个。

3. 用户自定义区：分为(1)(2)(3)三个小区。

(1) AAA1-AFFE，码位 564 个。

(2) F8A1-FEFE，码位 658 个。

(3) A140-A7A0，码位 672 个。

第(3)区尽管对用户开放，但限制使用，因为不排除未来在此区域增补新字符的可能性。

举例：

 String s="中文";
 byte[] b=s.getBytes("gbk");

bytes为

[-42, -48, -50, -60]

补码为：

【214,208,206,196】

转换为十六进展为

【D6，D0，CE,C4】

按照gbk表去查询汉字

编码完全匹配。

本文分类：生活常识
浏览次数：100 次浏览
本文链接：https://www.laihaile.cn/changshi/w0jlrG3gW6.html

上一篇 > 小米手机刷机详细教程（手把手教你降级）
下一篇 > 走鲸的进化（鲸类的进化之路）

你感兴趣的

2025陆家嘴论坛今日开幕若干重大金融政策将发布

证券时报记者张淑贤陆家嘴论坛再一次如约而至！今日，主题为“全球经济变局中的金融开放合作与高质量发展”的2025陆家嘴论坛将正式开幕。来自10多个国家和地区的70余名金融界人士，又一次相聚黄浦江畔，探讨如何进一步推进金融改革开放、深化国际金融合作以及参与国际金融治理，为世界经济增长注入新动能。202

美菱集成灶24小时服务热线是多少?如何联系?

美菱集成灶售后服务维修电话：400-883-8253美菱集成灶24小时维修客服热线：400-883-8253美菱集成灶24小时服务电话《今日发布》美菱集成灶附近上门服务电话7天24小时人工电话客服为您服务

老万热水器售后服务热线及常见故障解决方法汇总

我们了解，每一个家庭的老万热水器都是守护健康的重要伙伴，因此，我们的使命就是确保这些伙伴始终处于最佳状态。老万热水器售后客服电话：400-883-8253老万热水器由一群经验丰富的专业技术人才组成，他们对老万热水器的内部构造了如指掌，无论是日常维护还是深度修理，都能迅速找到问题所在，

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

6月16日，湖南省常德市临澧县山洲烟花有限责任公司发生爆炸事故，目前已造成9人死亡、26人受伤。为深刻吸取事故教训，防范同类事故再次发生，国务院安委会办公室决定对该起事故查处实行挂牌督办，要求按照《生产安全事故报告和调查处理条例》等有关法律法规及规章规定，抓紧组织开展事故调查，尽快查明事故原因，依法

20240个！Labubu？假布布！

海关查获超2万个假布布！据海关发布消息，近日，宁波海关所属北仑海关关员在对一批儿童玩具、塑料杯子等货物进行查验时，发现该毛绒玩具疑似侵犯“Labubu春日精灵系列”著作权。经联系权利人确认，该批货物均为侵权货物。经清点，侵权儿童玩具共有20240个。依照《中华人民共和国海关法》第四十四条、第九十一条

今年以来，“再担创业贷”带动创业就业超过33万人

创业就业关系着千家万户的生存发展，关乎着民生福祉和社会大局稳定。2025年2月财政部等六部门联合印发的《政府性融资担保发展管理办法》指出，政府性融资担保机构应当积极支持吸纳就业能力强、劳动密集型的小微企业和“三农”等经营主体，促进稳岗扩岗。今年以来，省再担保集团充分发挥自身在金融增信链条中的重要作用

今日推荐

2025陆家嘴论坛今日开幕若干重大金融政策将发布

2025-06-18

美菱集成灶24小时服务热线是多少?如何联系?

2025-06-18

老万热水器售后服务热线及常见故障解决方法汇总

2025-06-18

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

2025-06-17

20240个！Labubu？假布布！

2025-06-17

今年以来，“再担创业贷”带动创业就业超过33万人

2025-06-17

图文推荐

2025陆家嘴论坛今日开幕若干重大金融政策将发布
美菱集成灶24小时服务热线是多少?如何联系?
老万热水器售后服务热线及常见故障解决方法汇总
国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办
20240个！Labubu？假布布！
今年以来，“再担创业贷”带动创业就业超过33万人

首页

生活常识

实时讯息

家电百科

健康知识

科技数码

历史百科

民俗文化

手机版

汉字转unicode编码怎么用（中文转bytes，unicode转bytes java实现）

你感兴趣的

2025陆家嘴论坛今日开幕若干重大金融政策将发布

美菱集成灶24小时服务热线是多少?如何联系?

老万热水器售后服务热线及常见故障解决方法汇总

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

20240个！Labubu？假布布！

今年以来，“再担创业贷”带动创业就业超过33万人

今日推荐

2025陆家嘴论坛今日开幕若干重大金融政策将发布

美菱集成灶24小时服务热线是多少?如何联系?

老万热水器售后服务热线及常见故障解决方法汇总

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

20240个！Labubu？假布布！

今年以来，“再担创业贷”带动创业就业超过33万人

图文推荐

热点关注

汉字转unicode编码怎么用（中文转bytes，unicode转bytes java实现）

你感兴趣的

2025陆家嘴论坛今日开幕 若干重大金融政策将发布

美菱集成灶24小时服务热线是多少?如何联系?

老万热水器售后服务热线及常见故障解决方法汇总

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

20240个！Labubu？假布布！

今年以来，“再担创业贷”带动创业就业超过33万人

今日推荐

2025陆家嘴论坛今日开幕 若干重大金融政策将发布

美菱集成灶24小时服务热线是多少?如何联系?

老万热水器售后服务热线及常见故障解决方法汇总

国务院安委会对湖南常德山洲烟花有限责任公司爆炸事故查处挂牌督办

20240个！Labubu？假布布！

今年以来，“再担创业贷”带动创业就业超过33万人

图文推荐

热点关注

2025陆家嘴论坛今日开幕若干重大金融政策将发布

2025陆家嘴论坛今日开幕若干重大金融政策将发布