更新时间:2023-07-25 14:38
自旅美学者房骞骞(FangQ)于2004年10月创建迄今,文泉驿项目致力于开源汉字字体的开发,集中力量解决GNU/Linux高质量中文字体匮乏的状况。文泉驿已经开发并发布了第一个完整覆盖GB18030汉字(包含27000多个汉字)的多规格点阵汉字字库,第一个覆盖GBK字符集的开源矢量字库,并提供了包含字符数目最多的开源字体--GNU Unifont--中绝大多数中日韩文相关的符号。这些字库已经逐渐成为主流Linux发行版中文桌面的首选中文字体,得到了广大中文Linux爱好者的支持和喜爱。Ubuntu、Fedora、Slackware、Magic Linux、CDLinux使用文泉驿作为默认中文字体,Debian、Gentoo、Mandriva、ArchLinux、Frugalware则提供了官方源支持。文泉驿的网站(除了论坛)采用维基搭建。
作为几千年中华文明的见证,浩瀚传统文化传承的载体,汉字是让我们每一个中国人引以为豪的东方文明的标志之一。我们的祖先创造汉字,书写汉字,利用汉字和汉语的无穷魅力创造出让人叹为观止的文学,艺术。而今天进入了计算机时代的我们,虽然不再象古人一样手持毛笔,批著简帛,但我们的生活仍然无时无刻离不开汉字。
可以毫不夸张的讲,汉字①是世界上最为复杂和庞大的符号系统之一。早在殷商时期,我们的先人就创造出了数目巨大的甲骨文,从发掘出来的上万片甲骨中整理出来的单字就有四千余个,而东汉许慎编撰的“说文解字”,收录汉字9353字(一说10516)个。至清朝康熙年间的“康熙字典”收录汉字竟达47035之多。加上少数民族文字,各种古代典籍上曾经出现但并未广泛使用的古汉字和异体字,汉字总数多达十万以上。
我们是一群致力于在计算机世界中推广汉字,丰富电子汉字资源的志愿者,我们希望通过自己无私的劳动,使得无论你在世界上任何一个角落,都可以免费地获得我们的电子汉字资源,能够流畅地通过汉字进行交流。“文泉驿”是以上述目标为宗旨而自发创建的非赢利性组织。
对于制作电子汉字资源,文泉驿制定了如下子计划:
<#> 基于开放源代码②的点阵汉字库(优化屏幕显示)
<#> 基于开放源代码的矢量汉字库
<#> 基于开放源代码的汉字笔画笔序数据库
<#> 基于开放源代码的汉字图像识别系统
<#> 基于开放源代码的汉字笔画识别系统
<#> 基于开放源代码的汉字信息系统(解释,编码等)
<#> 开放的非官方电子汉字标准
具体来讲,我们希望完成覆盖Unicode 4.0所包含的7万多汉字的点阵位图(9pt,10pt,11pt,12pt等),笔画笔顺数据库以及基于笔画笔顺数据库生成的不同字型(细宋,中宋,报宋等)的矢量汉字库。这个工作还可以继续扩展到对所有汉字进行注音,释义,通过笔画笔顺进行汉字检索和分类,少数民族语言文字的点阵和矢量字体,以及汉字图像识别和笔画识别算法,软件的开发。
文泉驿计划的初衷是为了从根本上改变自由中文字体匮乏的现状,开发高质量、多规格、多字体风格的开源中文字体(点阵字体和矢量字体),解决中文 Linux发展的字体障碍,为中文发行版、开源中文软件的开发扫清障碍,降低中文Linux的使用门槛,从而让更多的人接触和使用Linux。
文泉驿计划正式开始于2004年10月,计划的第一步是在台湾志愿者Firefly完成的点阵的基础上开发完整覆盖Unicode中日韩统一表意文字区(共20902个汉字,等同于GBK字符集)在四个屏幕常用字号上的点阵字体,这个工作在王宏 (hotcat)等志愿者的推动下于2005年4月完成,共绘制完成了新点阵约15000多个,优化原有的Firefly点阵数万余个,并于2005年6 月正式发布了文泉驿点阵宋体。从2005年4月开始,点阵字体开发扩展到中日韩表意文字扩展A区(共6582个汉字)的工作在志愿者Nicholas Wang的积极参与下在2006年年中完成。此任务共绘制新点阵23000多个,与前面完成的字体结合,已经具备了完整的GB18030中文字符集覆盖。文泉驿点阵宋体经过参与者的不懈的改进,已经发布了四次主要更新(代号分别为文泉半两、苍龙、北斗和英雄-beta)。
与点阵中文字体开发平行启动的另外一个任务是开发高质量矢量字体,这个工作自2005年5月开始至2008年底,志愿者已经完成了超过27000个 CJK基本和扩展A区汉字及25000多扩展B区罕用汉字的笔画分解工作。文泉驿矢量字体--正黑体--也于2007年9月发布第一个版本(开发代号:紫箫)。该矢量字体至2008年已经历两次主要更新(开发代号分别为夸父和祈祷),并成为Wikimedia系统唯一支持的中文黑体字体。
文泉驿字体开发过程大多数是通过一个改写的Wiki及部分离线编辑软件完成。特别是在线点阵编辑部分是开发的一个重要环节和工具,由于Wiki本身具备了强大的协同开发能力,具有良好的版本控制和信息组织机制,同时汉字编辑本身具有很好的可并行性和颗粒化特性,所以该平台在整个开发过程当中显示了强大的生命力。
文泉驿点阵字体和矢量字体分别于2006年05月27日和2007年09月09日实现了“每日自动编译新字体”(nightly build)的功能,对于在使用中对字型不满意的汉字,用户可以进行方便地进行在线修改,经过管理员审核,用户第二天就可以下载到修改后的最新字体。
由于文泉驿点阵能够克服大多数纯中文矢量字体边缘模糊不清、不易阅读的缺点,而且风格统一,字型严格按照Unicode和国家标准制作,加之版权、授权明晰,在发布后的不久,便被很多Linux发行版本接受作为默认屏幕中文字体,更多地发行版将文泉驿纳入他们的软件仓库,提供用户动态更新下载。相信随着新版本的推出和时间的发展,会有更多的Linux发行版采用文泉驿开源字体。
对于常见的计算机操作系统,字体的显示算法需要一些字体的信息来优化屏幕显示效果,英文称为hinting。汉字由于笔画复杂,所以hinting的方式与西文截然不同。使用在汉字字体中嵌入预先制作的点阵位图既可以有效地避免hinting算法带来的计算开销,同时屏幕上显示的汉字边缘清晰,易于阅读。
同时,点阵汉字也是一种非常特殊的汉字形式,如何在点阵有限的网格空间上排步黑白像素,使得即能最好地表现出汉字的笔画特征,又能黑白匀称,显示优美,可以说,制作点阵汉字是一种艺术创作活动。我们制作的点阵汉字字库将可以使用在各种主流计算机操作系统上,特别是同样基于开放源代码的Linux操作系统。
在制作点阵汉字的同时,我们的其他计划也在同时着手开展。我们真心地希望有更多热爱汉字的朋友加入我们的行列,为中文用户减轻困难,为中国文化的传播作出自己的贡献。
①:这里的汉字包含汉语使用和曾经使用的方块汉字以及各个少数民族的语言文字,比如彝文,蒙古文,回文,藏文等。当然,我们的工作还会适当扩充到日语,韩语,越南语等其他东亚文字。
②:这里的开放源代码代表了“免费获得并可以后继开发”的原则,我们将会在这个基本原则上制定具体使用协议,或者使用现有的开放源代码使用协议(比如GNU General Public License)。
文泉驿计划欢迎任何有兴趣为公益事业奉献自己的时间和热情的朋友参与。参与文泉驿汉字开发活动不需要安装任何特殊软件,志愿者只需要通过浏览器浏览文泉驿网站,并使用在线绘图程序来制作和发送汉字图案信息,比如汉字笔画分解或者点阵绘制。参与者可以选择在任何方便的时间或者长度来参与这些活动。用户无私的参与将对开源中文的发展至关重要。
参与汉字开发的朋友通过浏览器浏览文泉驿的汉字开发界面(Canvas和Pixel),制作并发送汉字字型数据,参与者的账号名和所制作的汉字一起将记录在我们的开发日志当中,并作为为文泉驿所发布字体的一部分,所有参与者的信息将会包含在字体的发布文档当中,进入各个发行版的在线软件参考和千千万万中文用户的电脑中,成为文泉驿开源字体令人骄傲的奉献者之一。如果参与者选择创建编辑在线文档、教程,或者参与字体缺陷的报告或者论坛的讨论和回馈,他们的账号信息同样将进入文泉驿网站更新历史当中,成为开发过程当中的不可替代的重要环节。
没有时间参与文泉驿在线开发的朋友还可以选择其他方式来支持这个项目:他可以告诉身边的朋友对文泉驿字库的使用体验,或者考虑为他支持的发行版添加优秀的文泉驿字体;拥有个人博客的朋友可以考虑为文泉驿添加一个链接;如果他正在维护一个在线杂志或者是一个记者,对文泉驿和其他中文开源开发的宣传报道也可以大大提高开源中文在用户当中的影响力。另外,用户还可以选择通过捐款支持,文泉驿所有网站运行的费用都是通过有限数量的用户捐款维持的,用户的经济资助将会让这个项目走得更长远,开发出更多有用的中文资源。