三合一汉字输入法
 
理论探讨-9
 
           
   

 

统一汉字编码的途径、条件及前景

刘春华

(本文发表于《语文建设》1996年第3期)

  汉字编码“编”到今天,“编”出个百码争雄的局面。如果我们不尽快打破这个僵局,肯定会对我国的现代化、信息化进程产生不利影响。尽管汉字进入计算机的难题早已得到初步解决,却远远未达到理想的水平。尽快找到一种(或几种——但数量不能太多)理想的、统一的编码,实现“字同码”,是当代中国人的历史责任。如果说,古人“书同文”是汉字发展史上第一个划时代事件,那么,实现“字同码”则必将成为语文现代化进程中的一个重要里程碑。因此,国人当为此而努力,而奋斗。

  怎样实现“字同码”呢?

  途径之一:自由竞争,优胜劣汰,顺其自然,逐步统一。这听起来很合理,却是不现实的。道理很简单,当汉字编码作为一种商品进入市场后,其推广应用受到很多非编码因素的影响,以致于优者不一定“胜”,而劣者也不一定“汰”。有时甚至于孰优孰劣也分不清楚,所谓“各有千秋”。退一步来说,即使这种做法能够使优者胜,并最终达到众望所归的统一,历史的机遇也不可能宽厚到能够如此耐心地等待我们走完这段漫长的统一之路。

  途径之二:以行政干预的方式实现“字同码”,即国家有关当局强制推行统一的编码。可以说历史上任何需要全社会“统一”行动的事,都毫无例外地要走这一步。就拿汉字发展史来说,古代实行“书同文”,当代推广汉语拼音、简化字等等,莫不如此。因此,这是唯一可以实现“字同码”的方法。剩下的问题仅仅是时机的选择,即在什么条件下“强制”统一。既不能操之过急,做成“夹生饭”,也不能消极等待,拖延统一进程。这种“强制”,应该是有关机构积极推进、因势利导和审时度势的结果。当务之急,应尽快制定编码所需遵守的有关国家标准(如汉字拆分规范等),提出评判(而不仅仅是指标评测)编码优劣的方法和标准,并探讨、确立统一编码的目标。此外,尽管在目前条件下,编码属于一种“商品”,但考虑到这种商品的特殊性,应积极开展方案之间的对比评价,对于具有可比性的方案,最好进行一对一的比较,使专家和普通用户都知道其好在哪里、差在何方, 引导编码研究一步一个台阶,为统一编码创造条件。

  那么,统一编码需要具备哪些条件,或者说,理想的编码应该满足哪些要求呢?

  第一,规范性:编码必须符合语言文字规律,与汉语识字教育一致。在推广汉字编码时,“规范性”应该具有“一票否决权”,即不符合文字规律的编码不得推广。违反文字规律的所谓“汉字编码”与汉字长期共存,必将贻害子孙后代,给语文工作造成不可估量的损失。

  第二,易学性:汉字编码必须容易掌握。易学是编码普及的基础。汉字进入计算机早已不成问题,但中国正在进入电脑普及的时代,电脑已经不是少数专业人员手中的“宠物”了。电脑要进入千家万户,计算机教育要从娃娃抓起,中国要建立信息高速公路。而汉字的识字教育负担本来已经不轻,如果再加上一套与汉语基础知识没有内在联系的所谓“编码知识”要求人们掌握,显然是强人所难,行不通。近几年“编码大战”此起彼伏,令人目不暇接,而懂汉语拼音的普通用户十有八九仍在一如既往、无可奈何地敲打着拼音码。这一事实应该具有充分的说服力。除专业打字员外,很少有人愿意在从小就学汉语的基础上,再花大气力去学编码人“发明”的一大堆所谓“编码知识”。

  第三,高效性:编码必须达到一定的效率,当用于键盘输入时,应该具有较高的速度。这个速度应能满足专业打字员的使用要求。理想的编码不应该、也不必要分为适用于专业打字员和非专业打字员两种,而应该适用于全社会。编码方案本身应该为键盘输入时的高速度奠定基础,输入速度的高低仅仅取决于操作人员的熟练程度。否则,低效率的编码必将影响全社会的工作效率;同时,高速度的诱惑,仍将引出一些五花八门的编码输入法,从而破坏“统一”的严肃性。

  第四,通用性: 首先,编码应通用于需要用到编码的各种应用领域,如汉字排序、字典检索、键盘输入等等;其次,当编码用于键盘输入时,应同时适合于看打、听打和想打,并与国际通行的计算机设施兼容(例如最好不要另设一种汉字键盘);最后,编码适用的字符集应具有可扩展性,可“通用”于全汉字集。

  有一种观点认为,编码“编”到现在,在编码层次已经无所作为,难有突破,因为在编码层次解决不了“快”与“易”的矛盾;要想有新的突破,只有走“智能处理”之路。

  要将汉字方便地输入进计算机,而想到充分利用计算机的“高智能”,这是最合乎情理不过了。问题是过分依赖智能处理的编码满足不了通用性要求。如果基本问题不能解决于编码层次,而主要依赖于计算机智能处理,编码最终将不成其为“编码”,而仅仅成为一种纯粹的键盘输入法。从实用角度来说,这当然也未尝不可,毕竟,键盘输入是汉字编码最重要的用途之一。但是,这样一来,编码技术方案之争又演变成电脑软件功能之争。如此,汉字编码恐怕将永无统一之日。而汉字编码的其它应用领域,如中文检索等,也将永远一筹莫展。

  汉字编码输入,需要最充分地利用计算机智能处理技术,这一点毋庸置疑。但是,编码的基本问题必须解决于编码层次,而不能本末倒置。只有在编码用于键盘输入时,才有计算机智能的用武之地。

  迄今为止的编码史表明,计算机界的专家学者和技术人员为汉字编码及键盘输入法技术的发展作出了最为卓越的贡献。然而,汉字编码是一个新的综合性技术领域,涉及多学科知识,而其中最基本的问题, 毫无疑问应当首先涉及语言文字学 。电脑软件专家在整个汉字编码领域唱主角,似乎不能算是最佳“阵容”。要解决“编码层次”的问题,文字工作者和语文教育工作者们应当挺身而出、当仁不让地承担责任。因此,广大文字和语文教育工作者应该更加积极、勇敢、主动地投身到这项造福中华民族,造福子孙后代的事业中来,与电脑工作者一道,携手合作,共同努力,攻克难关,加速统一汉字编码的步伐。

  汉字编码统一的前景如何呢?笔者不揣冒昧和浅薄,作了下面的设想。

  前景之一:一步到位,在最高水平上统一汉字编码。一个方案通用于全汉字集。当然,可以分为不同的版本。普通用途使用普通版,字符集为国标基本集或稍作扩大(例如一万左右单字,直至采用GB13000—90);特殊用途可用专业版,字符集则根据需要来扩展;包括全部汉字的为全汉字版。但是,以上划分仅仅是根据字符集的不同而作的版本划分,各种版本均属于同一编码方案。从普通版上升到专业版再到全汉字版,应该具有规则的连续性和继承性,即高版本不能废除或更改低版本所用到的规则,只能增加某种不与低版本原有规则相冲突的新规则(例如,随着字符集的扩大,其组字单元可能要增加)。换句话说,高版本应该“兼容”低版本。

  前景之二:两腿走路,在高级水平上统一汉字编码,允许两种截然不同的编码方案并存。一个是适用于全社会的、普通用途的普通方案,字符集为基本集或稍作扩大;另一个是特殊用途的全汉字方案,以全汉字集为编码对象。

  前景之三:三足鼎立,在实用水平上统一汉字编码。充分兼顾各种不同的观点,使各种不同类型的编码,如形码、音码和音形码等,均有代表方案。这似乎并未实现严格意义上的“统一”,但可限制编码的“泛滥”,并可规范编码研究继续向更高水平发展。

  不管汉字编码统一的前景如何,有一点似乎应该肯定,即统一的汉字编码也必然是流行的、高效的字典检索法,并且应该与汉语基础教育相结合、相统一。