数据安全提示: 所有文本数据均在您的浏览器本地处理,不会上传到服务器,确保您的数据安全。
Unicode转换工具
Unicode 15.0
当前操作:字符 → Unicode编码 (JavaScript格式)
输入字符
字符数: 0
码点数: 0
多语言字符示例
Unicode支持全球所有主要文字系统,包括中文、英文、阿拉伯文、梵文、表情符号等。
中
U+4E2D
中文汉字
A
U+0041
拉丁字母
أ
U+0623
阿拉伯字母
😀
U+1F600
表情符号
Unicode编码结果
转换结果将显示在这里...
等待输入...
使用示例
"中" → Unicode编码
\u4E2D
"Hello World" → Unicode编码
\u0048\u0065...
"😀👍🌟" → Unicode编码
\uD83D\uDE00...
"\u4E2D..." → 解码
中文测试
Unicode算法原理
1. 什么是Unicode?
Unicode是一种字符编码标准,为世界上所有书写系统中使用的每个字符、符号和表情符号分配一个唯一的数字(码点)。 Unicode码点范围从 U+0000 到 U+10FFFF,共1,114,112个可能的码点。
2. Unicode码点表示
// Unicode码点表示方式
U+4E2D → "中"
\u4E2D → "中" (JavaScript)
0x4E2D → 十六进制
20013 → 十进制
U+4E2D → "中"
\u4E2D → "中" (JavaScript)
0x4E2D → 十六进制
20013 → 十进制
Unicode平面
Unicode字符被组织成17个平面(plane),每个平面包含65,536个码点。
平面0: BMP
基本多文种平面范围:U+0000 - U+FFFF,包含大多数现代语言的字符。
平面1: SMP
补充多文种平面范围:U+10000 - U+1FFFF,包含历史文字、音乐符号、表情符号等。
平面2: SIP
补充表意文字平面范围:U+20000 - U+2FFFF,包含CJK统一表意文字扩展。
Unicode编码方案
UTF-8
变长编码,1-4字节。兼容ASCII。
"中" → E4 B8 AD
UTF-16
2或4字节,BMP用2字节,补充平面用代理对。
"中" → 4E2D
UTF-32
固定4字节,简单但空间效率低。
"中" → 00004E2D