明快打字机将选择压缩到仅仅72个键
在QWERTY键盘上按下A键,字母“a”就出现在屏幕上。然而,在一个标准中文文字处理程序中按下A键的话,它触发了大约十来个发“a”音的中文字符。托马斯·墨磊宁(Thomas S.Mullaney)的《中文打字机:一段历史》(The Chinese Typewriter:A History,麻省理工学院出版社,2017年)一书讲述了中文打字机背后技术语言学创新的故事,也介绍了这些创新如何催生出当今中文电脑中使用的输入方法。
改进打字速度是优先考虑的目标。得失攸关的不仅仅是中文作为一种现代语言获得认可,而且对于数百万受雇于制作政府文件和商业文件的中国人来说,可能还关系到生产力的巨大增长。经济上、文化上和地缘政治学上的利害关系如此之高,以至于在150年以来,中国内部和中国以外(包括苏联、日本和美国)的工程师与语言学家努力解决“打印出中文字符”这个挑战。问题完全在于数量:对于一台实际可行的中文打字机来说,2 000到8 000个中文字符(在日语中称为“日文汉字”,在韩语中称为“韩文汉字”)被认为是基本要求。
墨磊宁指出,早期设计方案适应这种汪洋大海一般的大量字符的方式是将字符铸在一根根铅字条上,再组成一个矩形的托盘台。打字员必须搜寻和轻击想要的字符,一条机械臂会接着令字符凸出,印到纸上。这个挑战导致了旨在提高效率的分类学创新,这种创新令人入迷。中国人没有通过点算图形部件、部首或笔画(这些在中文拼写中都很常见)来将字符进行编组,他们的新方法是根据字符使用频率之类的因素对字符进行编组。
20世纪初叶开始的打字机实验时期,每个字符仍然有它自身的键;但是对墨磊宁来说,这段历史的主要教训是,发明者不久就开始倡导全新的文本输入方法。他们开始摒弃19世纪的直接输入键盘所代表的“即时性神话”,开辟了以新方式打印出中文的可能性,这种新方式接受了中文输入的特点,即你所打的文字与你看见的文字之间缺乏直接相关性。最终,他们做的研究工作导向了今日复杂深奥的文字预测引擎,该引擎从日益提高的处理能力和云集成中获益匪浅。现在的中文计算机输入法编辑器(IME)使得按下一个键就打出字符、整个单词、甚至常用句成为可能。
早期的数种设计方案中,一种废除了数千根按键铅字条的方案是1915年由纽约大学学生祁暄构思出的“拆分字形”打字机。该方案是将每个字符拆分成偏旁部首,再通过打字员将它们拼合起来。
然而,最有趣的发明、也是墨磊宁眼中中文输入法编辑器的最直系的祖先是明快打字机。明快打字机由杰出的文坛大家林语堂(1895―1976)在20世纪40年代中期发明,它拥有比当时寻常的中文打字机更多数量的字符铅字条――8 352根。然而,打字员(主要是林语堂的女儿林太乙)没有采用在数千个按键上搜寻-轻击的方法,只用应付72个按键。两组上下排列的按键容纳了中文字符的部件;另有一组按键容纳了八个数字键。这套机械装置的其余部分(包括字符铅字条)隐藏在打字机内部。从第一组按键中揿下一个键,将选择缩小到1/36;从第二组中揿下一个键,将选择继续缩小到8个字符或者更少。这些字符出现一个窗格内,再用数字键进行选择。
在这段“彻夜无眠、饱受折磨的历史”中,发明家与企业家“从未有可能像字母世界的同道中人那样立即取得成功,逐渐坠入舒适的梦境”。它产生了巨大但又姗姗来迟的影响。直到20世纪70年代,进入了计算机时代,改进中文打字机的努力(譬如明快打字机)才获得回报。接着,输入法编辑器将中文键盘改成“智能”外围设备,比起几无变化、相当蠢笨的字母输入法,它收到的用户指令要复杂得多。因此,墨磊宁介绍的这段历史是计算机输入的前史,接下来会有他的《中文计算机》一书(即将由麻省理工学院出版社推出)。
有人也许要问,键盘与输入的未来有怎样的相关性。毕竟,日本工程师研发出传真机,是为了逃避键盘的约束。在中文、日文或韩文打字机上打字依然困难、缓慢和累人,直到文字处理软件的出现;在一页纸上随意地写下字符更有效率得多。输入的未来会是什么面貌?声音识别也许会让我们完全回避键盘;有了配备触控笔的平板电脑,手写能够复兴。从这个角度来看,中文打字机的历史在部分程度上不仅仅是键盘的历史,还属于更宏大的书写史。
在那个更广阔的领域内,这本书与一些近期的著作――譬如丽莎·吉特尔曼的《纸上知识》(Paper Knowledge,杜克大学出版社,2014年)――一同探究技术与语言的交叉。中文打字机得以诞生,既要求对字母打字机进行技术上的反思,也要求对中文语言进行分类学上的重新整理。如果我们考虑到近期我们在阅读、书写、搜索和通讯方式上的变革――从电子书到智能手机的键盘,再到可搜索数据库和推特网数据流――以及这些改变影响一切的方式(从政治环境到科学研究),技术语言学上的转变比以往任何时候都更加与我们相关。《中文打字机》对近代史中一项最为重要的技术语言学壮举提供了一番迷人的探究。
资料来源Nature
责任编辑 彦 隐