Digidea关于字体字符集问题请大家帮忙!

[业界动态] 作者:Digidea 浏览次数: 08/10/07 15:44

从digidea博文里挪过来的,有兴趣的朋友可以参与一下!直接在digidea的博文里回复!

此文地址:http://digidea.blogbus.com/logs/29936068.html

 

 

  最近需要研究一下字符集的问题, 什么是字符集呢, GB2312, Big5 之类大家应该都听说过, 这些就是所谓的字符集, 每个集里面都包含一些字符, 但这些字符集都不是很好用, 目前已经被编码的汉字有 7 万左右, GB2312 是最小的一个简体中文字符集, 有 6763 个字, Big5 是台湾定制的繁体字符集, 13060 个字, GBK 是包含基础简繁体的一个字符集, 有 20902 个字. (等等...) 作为大陆的第一个字符集, GB2312 在统计时不够科学, 6763 个字里面有一大半是平时用不到的, 并且有很多我们常用的字它里面没有, 还不包含繁体. GBK 是在 GB2312 的基础之上进行扩充的, 那些无用的字无疑仍旧包含在里面, GBK 基本能够满足我们日常的用字需求, 但是试想一下, 每当制作一个普通字体就要绘制 2 万多个字, 这是一项做么大的工程啊... 很多人都认为, 1 万 (甚至 5 千) 个字, 就已经足够我们使用了, 因此, 我想统计一套方便自己使用的字符集, 去掉那些偏僻字, 只保留常见的, 而且又尽量够用.

  IICore (国际表意文字核心) 是 Unicode 组织为了减轻由于汉字过多而对字体制作者和使用者造成的压力 (主要指移动设备) 而制定的一套标准, 它由中国大陆, 台湾, 香港, 澳门, 北朝鲜, 韩国, 日本所统计出的常用字汇总而成, 共 9810 个字. 不过它也不是很合适, 因为包含了北朝鲜, 韩国, 日本的特用汉字 (指他们自己造的而大中华区域不使用的), 而且仍旧有一些常用字没有被收录进去 (统计的人都脑残了...), 比如我经常会用到的 "诶", 所以我想在 IICore 的基础上增加/减少一些字符, 最终做成比较理想的一套字符集.

  那么现在就需要大家来帮忙了, 我做了一款专门的字体, 它里面只包含 IICore 的 9810 个字, 并且我对这些字的图形进行了一些处理. 安装上这款字体后, 在任何一个软件中, 从字体列表上选择 "IICore" 就可以使用了. 我想让大家帮忙查找平时能够用到但是这款字体中没有的字, 具体方法是这样的: 比如网页上的一篇文章, 你可以将它复制到记事本中, 然后将字体更改为 IICore, 字号稍微大一些. 我们都知道 Windows 系统中所选字体不包含的字符将以宋体替换, 所以一眼就可以看出 IICore 字体中缺少哪些字, 效果图如下 (这个是在 Word 中).

  从图中可以看到, 那些乱七八糟的就是 IICore 中包含的字, 那个突出的 "棰" 就是字体中不包含而调用宋体显示的字, 遇到这样的字, 就请大家告诉我. 大家可以找各种东西来测试, 比如小说, 剧本, 歌词, 自己写的文章等等等等, 一些文献类可能涉及到过多偏僻字的就算了. 因为这个对我接下来要做的很多事情都很重要, 所以请大家一定要帮帮忙啦.

  十分感谢!

点击这里下载 IICore 测试

点此关闭窗口

快捷键ESC

手机浏览更方便: