1950-1960年代我国自动翻译概况
2020-03-13吴稌年
●吴稌年
(江南大学 江苏无锡 214122)
在我国图情计算机应用领域中,最早被列入国家发展规划的是运用电子计算机进行自动翻译(亦称机器翻译)的项目,因此,在研究计算机在图情领域应用的历史中,计算机自动翻译的发展是十分重要的。
1 科技情报翻译任务甚重
在大规模地开展社会主义建设事业过程中,发展至1955年,我国的第一个“五年计划”即将提前完成,并将更大规模地开展第二、三个“五年计划”。在此关键时刻,急需一个国家中长期的发展战略规划作指导。是年,党中央决定制订我国“十二年科学规划”。1956年,《1956-1967年科学技术发展远景规划纲要(草案)》(以下简称《规划纲要》(草案))公布,要求我国在某些重要和急需的部门在12年内接近或赶上世界先进水平。在规划中,从13个方面提出了57项重要的科学技术任务。科学情报工作被列入第13方面的“若干基本理论问题和科学情报”中。这一表述,突出了情报工作为科学技术服务的基础性和先行性的特点,并作为第57项“科学技术情报的建立”而单独列项。这是党和政府根据我国科学技术发展战略的需要,以及我国情报工作十分薄弱,必须迅速加快建设而提出的,是周恩来总理和多位国务院副总理经过深思熟虑后列入其中的。创建我国科技情报体系,必须先筹建专门机构,“1956年10月15日,中国科学院科学情报研究所在北京朝阳门内大街117号礼堂召开正式成立大会”[1]7,它的成立,“标志着中国科技情报事业的开始”[2]。我国情报研究所的及时创建,除了党和政府的重视外,另有二个方面的重要因素。其一,1955年11月,苏联科学院技术科学部教授拉扎连柯接替柯夫达任中国科学院院长顾问。他根据苏联的经验,“建议中国按照苏联科学院成立情报所的做法,成立中国科学院科学情报研究所,开展中国的科技情报工作”[1]2。他的建议,受到我国党政领导和相关部门的高度重视。其二,我国知识分子,尤其是高级知识分子的促进作用,如钱学森先生于1955年10月归国后,迅速投入到国防建设事业中,1956年2月,他向国务院提交了《建立我国国防航空工业的意见书》,意见书中“指出我国航空工业完全依靠苏联提供的资料,缺乏为设计用的工程及科学资料”[3]。钱学森先生在编制《规划纲要》(草案)的过程中,担任综合组组长,他十分重视并大力倡议《规划纲要》(草案)中对科技情报工作的体现[3],这些因素促进了《规划纲要》(草案)中第57项重大研究任务的产生,促进了我国情报研究所的尽快诞生。
刚成立的中国科学院科学情报研究所,在《规划纲要》(草案)中明确了它的基本任务:“从事摘录全世界科学技术期刊上的论文,用快报和文摘的形式编印出版。”[4]在中国科学院科学情报研究所的成立大会上,中科院院长郭沫若先生进一步强调了情报所的“主要任务是收集、研究和报道国内外特别是科学技术先进各国科学技术部门的发展情况和最新成就。目前以编译快报、文摘等刊物为工作重点,将来发展到直接由原始文献编辑出版各科文摘”[5]。可见,我国的情报工作是从编译资料开始的。
我国规范、规模、有组织有计划地翻译科技情报工作始于1956年,在1957年有了进一步的发展。“1957年8月19日,科学情报研究组成立”[1]20。中国科学院科学情报所将编译室划分为4个分室。情报研究所自成立起,就开始了《机械制造文摘》等的翻译出版工作,至1959年,中科院已翻译出版的文摘有:《机械制造文摘》(9个分册)、《冶金文摘》(2个分册)、《力学文摘》(4个分册)、《物理学文摘》(3个分册)与《地质文摘》(2个分册)等[1]27,另有一些其它形式的出版物。尽管如此,翻译问题还是远远不能满足日益增长的需求,由此,利用计算机进行自动翻译的研究,在我国开展了起来。
2 我国早期自动翻译概况
我国对自动翻译的规划开始于1956年,并具有国家顶层设计的特征。当时我国科技界对将计算机技术应用于自动翻译的可行性、重要性与迫切性方面已有所了解,这一认识,集中反映在《规划纲要》(草案)中:“电子计算机在科学研究、生产过程、国防应用中甚至在整理资料和文字翻译工作中都已有应用。”[4]通过计算机进行文字翻译,已成为我国当时科技界“重点发展、迎头赶上”的重点任务之一。由于自动翻译的跨学科特征,在《规划纲要》(草案)中,将其列入“计算技术的建立”的第41项任务中,是项任务是以电子计算机的设计制造与运用为主要内容,并明确“关于利用电子计算机进行自动翻译的工作,首先由语言学家和数学家协同研究翻译中字汇范围和文句结构,并编制运算程序,然后进行实际操作的研究”[4],并列有具体的研究课题:“我国于1956年便把机器翻译研究列入了我国科学工作的发展规划。课题名称是‘机器翻译、自然语言翻译规则的建立和自然语言的数学理论。’”[6]
1957年起,我国科技工作者进入到了自动翻译研究行列,以研究俄汉自动翻译为先,亦研究英汉自动翻译,但研究俄汉翻译方面的力量投入比较大。为了借鉴苏联在这方面的科学技术,我国翻译出版了苏联学者的《自动翻译》的小册子、《机器翻译联合会会报》杂志等书刊,中科院语言所和计算所协作研究制订俄汉自动翻译规则系统。起步阶段,我国相继派出若干骨干前往苏联学习自动翻译技术,“刘涌泉同志曾于1957年赴苏专门学习自动化翻译,1958年回国后,负责组织我国机器翻译的研究”[7]。随后,“1958年7月,国家派出2名业务干部蒋映鹏、赵宗仁到全苏科技情报研究所专门学习机器翻译与机器检索技术,回国后,他们对苏联情况做了详细介绍”[1]41并投入到了研究工作中。此时,根据实际情况,我国科技情报界对自动翻译问题的认识已兼顾到文献检索技术方面。
1958年,我国加快了自动翻译的研究工作,中国科学院科学情报研究所、中国科学院语言研究所和计算技术研究所合力组成自动翻译研究组,开展俄汉、英汉自动翻译的研究。他们“集中在中国科学院计算技术研究所第三研究室内办公”[1]41。若干高校也陆续成立了自动翻译组并开展了研究工作,如北京外语学院、哈尔滨工业大学、哈尔滨医科大学、华南工学院等,“同年7月,我院俄语系(当时为北京俄语学院)也参加了这一研究工作”[8]。不久该学院就成立了俄汉和英汉自动翻译两个研究组,继续和中科院合作研究。他们的合作研究,主要根据苏联学者彼得罗夫斯基的《偏微分方程讲义》一书为材料,设计出了一套俄汉自动翻译实验型规则系统,在建国十周年前夕,进行了我国首次自动翻译试验。这次试验,“词典包括2 030个词,语法规则系统由29个线路图表组成。试验了九句不同类型的较复杂的句子”[9],获得较好的效果。
我国从一开始就将自动翻译的要求提得较高,目标是全自动翻译,而尽可能舍去翻译过程中的人工干预,因为“我们是主张不要译前、译中、译后加工的,目标是朝向全自动高质量的翻译”[10]。尽管起步阶段译文质量可能会差些,但是随着对自动翻译的理论与实践知识与活动的理解不断加深,获得较为满意的译文是完全有可能的。因此,我国在研究过程中所产生的方案都是按照这一精神设计的。在首次试验过程中,由于还没有汉字输出装置,利用穿孔纸带输出的句子是汉语代码,它的意义是重大的:“我们这次的试验可以说是机器翻译历史上的一次重要的试验,因为它解决了两种不同类型的语言之间的翻译的一些比较复杂的问题,如词序问题。”[11]在试验过程中,俄文用数学专业文献作试验,还有其他一些研究组用机械制造专业和控制论的文献作研究素材,使用的是形态结构分析法,这一方法是根据词的形态分析句子。英文的以原子能文献作对象,采用的是句段分析法,这一方法主要是根据词的位置、前置词、词的搭配等进行分析,通过初步的试验后,再作进一步修订和改进。这一时期的试验,还限制在一个较小的范围,大致限于一本书和一本书的某一部分。
1958年12月9日,中国科学院科学情报研究所改称为中国科学技术情报研究所。1961年,以中国科学技术情报研究所、中国科学院语言研究所、计算技术研究所为主,集中了若干大学和科研单位的力量,在过去自动翻译研究成果的基础上,完成了俄汉自动翻译61型自动翻译规则系统的编制工作。这一新方案与59年的老方案相比,无论在机器词典和机器语法方面,都有了很大的改进,“而且与同时期的国外自动翻译规则系统相比,也达到了较高的水平”[12]。由于当时国家遭受经济困难,以及科研任务的调整,这一方案未能及时上机试验。1963年,根据我国社会主义建设的任务,在“十二年科学规划”的基础上,参照国际科技进展情况,制订了《1963-1972年科学技术发展规划纲要》(以下简称《十年规划》)。这一《十年规划》,从1962年春季开始,经过整整一年,动员组织了我国各方面的专家学者,制订出了重点研究试验项目374项。在这《十年规划》中,并没有将自动翻译阐述其中,而是对诸如计算机技术等问题更加泛化,需要研究的问题更加广泛。如在计算机技术的十年发展规划中,其主要研究的问题是:“计算机数学、计算机理论、通用计算机、控制计算机、讯息加工、讯息存贮、小型化技术以及设备结构工艺等有关问题。”[13]此时,讯息加工、讯息存贮等问题列入了重点研究发展项目之中,而自动翻译则经过若干年的研究,已有一定的基础,需要有专门力量和部门继续进一步加以研究发展下去,由此,“1963年,机器翻译的研究纳入《全国科技情报工作十年发展规划》”[14]。是年,在中国科学技术情报研究所的新方法室,正式设立了机器翻译研究组,标志着我国图书情报界开始更深入地切入这一研究领域。自动翻译研究组将当时出版的《无线电文摘》作为研究对象,进一步研究、设计自动翻译规则系统。“到1965年底,已经用《自动化通讯》索引英文题录作为语言材料,进行翻译系统的语言模型的研究”[14]。
3 我国早期的自动翻译学术研究
我国专文研究自动翻译问题始于1956年。是年,藏文专家于道泉教授在中央民族学院院刊上发表《谈谈翻译的机械化》一文。文中提出了于先生根据自己的翻译体会和期望,提出了翻译机械化的初步想法。在国际上,通过国际会议交流自动翻译的学术思想,始于1952年。是年,美国麻省理工学院召开了第一次机器翻译会议,这次会议有18位英美从事自动翻译的学者参加,会上作了15篇报告,较广泛地交流了相关学术问题。我国自动翻译专家登上国际学术交流舞台,介绍我国自动翻译试验情况,则是在1958年。是年5月15日-20日,在莫斯科召开了自动翻译会议,参会人员达300余人,提出报告70余篇,我国刘涌泉先生参会并作了《俄汉机器翻译中的词序问题及其解决办法》的报告,这是我国专家首次出席国际自动翻译会议。报告中首先简述了我国从1958年1月开始的关于自动翻译项目试验的概况,简述了自动翻译中词序的概念和意义,随后详细介绍了俄汉自动翻译中词序这一核心问题的解决办法。这一报告随后刊在我国1959年《语言研究》杂志的第四期上,成为我国早期在自动翻译领域中的核心学术论文之一,也为刘涌泉先生以后在我国早期自动翻译领域中核心学者的地位确立,奠定了坚实的基础。1960年5月12日-13日,中国科学院语言研究所、计算技术研究所、情报研究所、第一机械工业部所属第一设计院及北京外国语学院俄语系俄汉机器翻译研究组等单位,召开了俄汉机器翻译座谈会,主要交流了自动翻译中语言部分的相关学术问题。他们各自介绍了研究情况与获得的研究成果,会上着重讨论了词的存储形式、标点符号的分析、名词句法成份和同等成份的分析,及综合部分的加工原则和方法[15]。这是在制订我国自动翻译新的规则过程中的一次重要的学术交流。
1964年,我国诞生了第一部自动翻译领域的专著《机器翻译浅说》,标志着我国在这一时期的研究中已达到较为成熟的阶段。
在这一阶段,最主要的核心研究人物是刘涌泉先生,他创造了我国自动翻译领域的多个第一:第一个赴苏联专门学习自动翻译。他于1958年回国后一直从事自动翻译的研究工作;第一个参加国际自动翻译学术研讨会,并在会上作专题报告,促进了国际交流工作;第一个负责组建和研究自动翻译项目者之一,为我国早期自动翻译试验项目的进展作出了较大的贡献;第一部自动翻译专著的主要作者等等。他是我国早期自动翻译研究中最重要的理论研究者,在笔者所搜集到的1956年-1965年10年中这一领域主要的11篇论文中(不包括译文),刘先生独著的论文有4篇,合著的有4篇。独著的4篇是在1958年-1959年两年中发表的,说明了这一时期刘先生学术研究的钻研精神之强烈,同时也说明了这一时期我国对自动翻译研究问题的力量十分薄弱,还没有形成一定量的、密不可分的研究团队,而诸如此类项目,是必须要有团队相互协助、互相配合、互补学科知识才能深入发展的。这一问题从1959年起有所好转。是年,北京外国语学院俄语系俄汉机器翻译研究组发表了《俄汉机器翻译中的语言分析问题》一文,1960年,中国科学院计算技术研究所三室五组发表了《俄汉机器翻译试验》的论文。大致在1960年代初,中科院语言研究所形成了以刘涌泉、高祖舜、刘倬为核心的研究团队,他们在1962年-1965年至少合著发表了4篇学术论文和公开出版一部专著。以刘涌泉为首的学术研究团队,成为这一时期的学术研究的核心力量之一。
4 结语
1950-1960年代,属我国开始研究自动翻译问题的早期阶段,从国际范围来看,我国对自动翻译的研究也是属于较早的国家之一,我国1959年9月对俄汉自动翻译试验项目的试验成功,标志着此时我国对自动翻译的研究已列入国际较为先进的行列,对此,刘涌泉先生明确指出:“我国是世界上第五个进行机器翻译试验的国家,翻译的材料比前面一些国家的难度大”。[16]自动翻译的研究,开创了我国图情领域计算机应用的历史。