三合一汉字输入法
 
理论探讨-6
 
           
   

 

让电脑为语言文字规范化服务

刘春华

(本文发表于《语文建设》1997年第7期)

  随着电脑的日益普及,电脑文字处理方式对语言文字规范化的影响越来越大。这种影响可能是正面的,也可能是负面的。现状不容乐观:诸多不规范的键盘输入法对语言文字规范构成冲击并造成混乱,不规范的电脑字、词库正成为社会上不规范用字的一个重要源头。今后,用电脑“写”东西将变得越来越普遍,随着用“想打”方式输入汉字的用户群的扩大,“想打”者的平均语文水平也必然会下降到一个更低的层次,特别是今后中、小学生都将使用电脑来学习,让电脑为语言文字规范化服务就显得更有意义。这一问题应该引起我们足够的注意和重视。

  要让电脑为语言文字规范化服务,需要语文界和电脑界共同努力。本文提出几点不成熟的想法,供语文界和电脑界参考。

  一.汉字输入法的基础词库不宜过小

  词输入方式有利于减少错别字的出现,前提当然是词库中的词语都是正确的(虽然分词方法不一定规范、统一)。这一点显而易见,因为人们不可能用词输入方式输入词库中不存在的、含有错别字的词语。基于此,那种将基础词库设计得很小,而将大量的基础词汇都留给用户“自造”的做法似不足取。因为用户的文字水平千差万别,“自造词”中很可能混入含有错别字的“错词”,这种“错词”一旦成为电脑词库中的“成员”,不但造词者自己一误再误不能自察,而且如果多人共用一台电脑,还很可能造成“谬种流传”,误及他人。而无论在企事业单位,还是在中小学校,多人共用一台电脑都可能是较为普遍、并将持续相当时期的现象。因此,当电脑逐步向全社会普及之际,汉字键盘输入法采用权威的通用词库可能是一种理想的做法。顺便提一下,笔者充分肯定“自造词”功能在键盘输入时的积极作用,只是说,通用性强的基础词汇不宜留给用户“自造”。

  二.汉字输入法容错码的设置要考虑文字规范

  键盘输入法既然是一种商品,其制造商自然要想方设法迎合用户的要求(包括一些算不上恰当的要求),因此,便有了各种“容错”功能。你拼音不准确?没关系,你大胆“拼”,电脑很聪明,知道你“想”要什么;你写字“倒插笔”?小意思,你凑合“写”,电脑很宽容,不拘小节……如此等等,用户似乎也乐意享受这种“礼遇”。但这种做法显然不利于文字规范化。用户在文字方面的“错”,不仅得不到应有的纠正,反而获得了电脑的默许和纵容,这种“错”就会进一步强化。笔者以为,一种好的键盘输入法,不但常规码要符合文字规范,容错码的设置也同样要考虑对文字规范化的影响。建议从两个方面来考虑。一是让容错码本身也符合文字规范,例如,拼音不准确时,不是容忍“拼错”,而是允许改用规范的字形元素(如笔画、部首或部件等)代替字音元素,或者反过来。也就是说,所“容”之错,其性质并不属于违反文字规范。二是如果违反文字规范的容错码难以避免,则最好在用容错码输入字、词的同时,也显示正确码,以提醒用户注意,即在“容错”的同时“纠错”。

  三.中文文本编辑器宜设查错功能

  英文文本编辑器一般设有单词拼写检查功能。中文文本编辑器也应设置查错功能。但是,中文词与英文词性质不同,不好按英文的方式查错。英文的拼写检查,一般是以一部在线词典及有关的词法规则作蓝本,启动“拼写检查”功能,若发现文本中出现词典中不存在或不符合词法规则的拼写,电脑将提醒用户注意,并提供若干拼写相近的正确单词供用户选择替换。当然,词典容量无论多大也总不能包罗万象,词典中不存在的拼写也可能是正确的。查错功能仅仅提醒用户注意,若认为正确,则可以跳过去。中文显然不可能按这种方式查错,因为中文的书写单位是字,人用笔可能写出“多胳膊少腿”的错字,但用电脑却打不出这种“错字”。如果有错也只能是“别字”、“多字”或“少字”,或者说是“错词”。然而中文查“错词”却不那么容易。中文查“错词”需以电脑自动分词作基础,而目前自动分词还未解决好。作为权宜之计,能否先搞一个“低层次”的查错呢?用正确词典作蓝本有困难,反过来行不行?就用“错词词典”作蓝本,若发现文本中有与“错词词典”中一样的词,就提醒用户注意。只要根据社会语言实践,编写一本“错词词典”,中文文本编辑器就可用它来查错。例如,“仅祝”疑为“谨祝”之误,“欢渡”可能是“欢度”,“按装”也许是“安装”,“调济”、“临摩”和“寒喧”看上去象是“调剂”、“临摹”和“寒暄”,诸如此类,均可用查错功能提醒用户注意,并提供可能的、正确的词供用户选择替换。由于语言现象千变万化,遇有电脑疑为有错而实际未错的“字串”时,用户确认后即可跳过去。说这种查错属“低层次”,因为它只能查出“错词词典”已收录的“高级”错误,对于象把“太阳”写成“大阳”、“练习本”误为“练习木”之类的“低级”错误则无从查起,因为不可能把“错词词典”搞得很大,而只能收录一些发生频率较高、较典型的“错词”词条。

  有了查错功能,再加上以标准词库为基础的词为主导的输入方式,至少可以减少常见错别字的出现。有电脑提醒和“把关”,用户的文字水平还可能得到提高。