集萃丝印特印网 版权所有 Copyright©2003-2022 ccedwy.com. All Rights Reserved
丝印特印网
【集萃网观察】勇于创新 青年科学家王选攻克汉字计算机处理技术难关
汉字是中华民族智慧的伟大创造,它一字一义,直观简明,语法简单,词序排序规则,富于想象和联想,联合国各国文字的文件中最薄的总是中文。但是,汉字是一种方块字,结构复杂、笔画多、字数多、字体多、一字一音,书写和读音都比较困难。 《康熙字典》收入的汉字多达47000多个,现在常用的也有6700多个,这么多的字要认、要记、要用,对于一般老百姓来说确实是一件很困难的事。
20世纪中叶, 电子计算机技术在世界范围内迅速发展, 极大地推动世界各国社会经济文化的进步,人类进入了信息化时代。用计算机处理信息,包括数据、文字、图形、语言等等,但基本的是文字信息处理。西方国家采用拼音文字,一般字母只有几十个(英文为26个) ,字形简单,信息量较少,容易实现对文字信息的处理。而我国汉字字数多,印刷用的汉字字体也多,有宋体、黑体、楷体、隶书体等10余种,还有10余种不同字号,印刷用的汉字字模数量超过65万个,其对应的存储量超过200亿字节,比西文信息存储量高出上百倍。要使系统软件具有汉字处理和西文处理互相兼容的能力,许多人都认为是一道难以逾越的障碍,一个世界性公认的难题。
1975年,北京大学王选等一批年轻的学者立志攻克这个世界性难题。那时王选38岁,北大数学系毕业,在北大无线电系任助教。他们接受了国家计委和电子部安排的“汉字信息处理技术”国家重点研究课题中的汉字精密照排项目任务。这个课题因在1974年8月立项,因此被称为“748工程” 。
王选反复地研究汉字字形的特点和规律,他发现汉字虽然字形繁多,但基本笔画还是很有规律的,如横、竖、折等是由基本直线和起笔、收笔及转折等笔锋所组成,这种规则笔画占汉字笔画总数一半以上。这种规则笔画以宋体为例,可用4~5个字节表示,这样对提高压缩倍数起了重要作用。对不规则笔画,如撇、捺、点等虽然不规则,但也有一定的曲线变化,也有规律可循,可以用一连串折线逼近其轮廓曲线。王选一连几个月趴在桌子上用放大镜分析汉字字形的规律,进行艰苦复杂的统计和比较,精确地计算不同笔画的曲率变化,再分类合并,用参数描述横、竖、折等规律笔画的长、宽、倾斜度及变化多端的各种笔锋,用轮廓描述点、撇、捺等不规则笔画,这样使汉字字形信息量下降数百倍。同时,他还研究出一整套把折线轮廓复原成点阵的快速算法和使文字变倍失真尽可能小的变倍算法。高倍率汉字信息压缩技术,高速度还原技术和不失真的文字变倍技术是汉字激光照排技术的核心。这项技术的突破就打开了用计算机进行汉字信息处理的大门,表现了中国人的聪明和智慧。
瞄准世界先进水平 实施跨越式发展
在汉字信息压缩和还原技术取得重大进展的基础上, 王选着力研究汉字经过计算机信息处理后的输出问题。当时,世界上在照相排字技术上已经发展了“四代” 。第一代是手动照相排字,我国20世纪60年代已经应用,但效率很低,难以推广;第二代是光机式照排机,加工精度要求很高,技术难度很大;第三代是阴极射线管照排机,德国在1965年推出,技术逐步成熟,开始在世界先进国家应用,但我国还处在研究阶段;第四代是激光照排机,英国在1976年研制成功,但是,王选他们并不知道。
正当王选苦苦思索输出技术方案时, 他了解到邮电部杭州通讯设备厂研制成功报纸传真机,采用录影灯作光源,具有照排机类似功能,思路豁然开朗,但他在这方面并不内行。于是,他就跑到物理系去请教,在与北大物理系老师们共同努力下,将光源改用激光光源并且将单光路改为四路平行激光扫描,输出速度一下提高四倍。因此,他们决定与杭州通讯设备厂合作,将报纸传真机改造成汉字激光照排机。这样王选决心跨过第二代、第三代照排机,把目标定在发展第四代激光照排机上,走跨越式发展的路子。
从技术方案到形成系统原理性样机很不容易,王选他们放弃所有节假日,整整奋斗了5年。国家计委、电子部为这个项目安排了必需的科研经费,北大老校长周培源组织学校各方面力量为他们创造了必要条件, 山东潍坊计算机公司、 杭州通讯设备厂等通力协作。 1980年夏,王选他们用研制成功的原理性样机排印出第一本样书??《伍豪之剑》 。一位领导同志看了后批示说: “这是可喜的成就,印刷术从火与铅时代过渡到了计算机与激光的时代” 。邓小平同志批示“应加支持” 。这套原理性样机系统被命名为“华光Ⅰ型” 。
王选的成功说明,中国有优秀科技人才,他们有聪明才智。汉字信息处理的软件技术,是我们的优势。现阶段我国综合经济实力还不强,要全面赶超世界先进水平不现实。但是,我们有自己的优势,发挥这个优势,集中力量就能出奇制胜,实现跨越式发展。汉字激光照排技术的突破就是一个创举,一个范例。
来源:必胜网
该文章暂时没有评论!