你知道在计算机中汉字是如何存储的吗？

[业界动态] 作者：字体学者浏览次数： 23/04/13 15:19

计算机中汉字使用Unicode编码进行存储。

Unicode是一种国际标准字符集，它为世界上所有的字符都分配了一个唯一的数字编码，包括汉字、拉丁字母、希腊字母、日文假名等。Unicode编码可以使用不同的编码方式进行存储，如UTF-8、UTF-16等。在计算机中，汉字通常使用UTF-8编码进行存储。
在这里插入图片描述

Unicode编码是一种字符编码方案，用于将字符集中的每个字符映射到一个唯一的数字值。

它包含了世界上几乎所有的字符，包括各种语言的字母、数字、标点符号、符号、表情符号等。Unicode编码的目的是为了解决不同国家和地区使用不同字符集的问题，使得不同的计算机系统和软件能够正确地显示和处理各种语言的文本。Unicode编码通常使用16位或32位的数字表示一个字符，其中16位的编码称为UTF-16，32位的编码称为UTF-32。
在这里插入图片描述

Unicode编码的历史可以追溯到20世纪80年代初期，当时计算机系统的字符编码方式非常混乱，不同的计算机系统使用不同的编码方式，导致在不同系统之间传输和处理文本数据时出现了很多问题。

在这里插入图片描述

为了解决这个问题，国际标准化组织（ISO）于1987年成立了一个委员会，负责制定一个全球通用的字符编码标准。这个委员会最终制定了ISO 10646标准，该标准定义了一个包含所有世界上已知字符的编码表。

在这里插入图片描述

然而，由于ISO 10646标准的实现成本较高，且与已有的字符编码标准存在冲突，因此在1991年，Unicode联盟成立，旨在开发一个与ISO 10646兼容的字符编码标准。Unicode联盟最终制定了Unicode编码标准，该标准定义了一个包含所有世界上已知字符的编码表，并且与ISO 10646标准兼容。

Unicode编码标准的发布和广泛应用，使得不同计算机系统之间的文本数据传输和处理变得更加简单和可靠。目前，Unicode编码已成为全球通用的字符编码标准，被广泛应用于计算机系统、互联网和移动设备等领域。