早在2018年的Unicode 12第8版定义了超过一百种语言文字的12万个字符的码点。天然适合保存单个文字符号的数据类型是int32,为Go语言采用。rune类型作为int32类型的别名。我们可以将文字符号的序列表示成int32值序列,这种表示方式称作UTF-32或UCS-4,每个Unicode码点的编码长度相同,都是32位。
\uhhhh表示16位码点值
\Uhhhhhhhh表示32位码点值
每个h代表一个十六进制数字,32位码点值几乎用不到
官方公告:
http://www.unicode.org/versions/Unicode12.0.0/
新增列表:
https://www.unicode.org/charts/PDF/Unicode-12.0/
快捷键ESC
手机浏览更方便: