APP下载

对记忆辅助型长字符英语自动翻译系统设计的分析

2019-10-07吴晓娟

校园英语·下旬 2019年9期

【摘要】结合长字符英语自动翻译系统设计需求,本文提出采用翻译记忆方式实现记忆辅助型自动翻译系统设计,能够通过语义特征提取加强系统输出结果与上下文的匹配,利用词语间互信息完成翻译反馈校正。从系统性能仿真结果来看,系统翻译最大能达到100%的匹配率,数据召回率最大为40%,因此能够保证翻译准确性。

【关键词】翻译记忆;长字符英语;自动翻译系统

【作者简介】吴晓娟(1980.01-),女,汉族,甘肃兰州人,兰州理工大学,博士,讲师,研究方向:语言学及跨文化交际。

引言

在跨语言交际方面,语言障碍成为为沟通交流的最大阻碍。在翻译内容日渐增多背景下,已经无法单纯依靠人工翻译解决沟通问题,所以需要完成自动翻译系统研发。但目前该类系统在长字符英语翻译方面无法保证准确性,因此还应加强记忆辅助型长字符英语自动翻译系统设计,以促进计算机翻译技术的发展。

一、记忆辅助型长字符英语自动翻译系统设计需求

在对长字符英语进行翻译时,采用自动翻译软件通常会出现译文语序组合不当、译义选择有误或修饰关系不准确等问题,造成译文与原文内容存在较大偏差。出现这种情况,主要是由于传统机器翻译基本是根据规则进行翻译,受分析技术限制,翻译方法以句法直译和转化为主,侧重于语法分析,使得译文可读性和准确性受到了较大影响。针对这一情况,采用翻译记忆与计算机辅助翻译方式,能够将源语言和翻译得到的译文对照存入计算机记忆库中,作为翻译的源语言进行使用。在计算机系统自动进行长字符英语翻译时,可以通过数据搜索完成模糊匹配。因此针对带有特殊语义的长字符英语来讲,设计记忆辅助型自动翻译系统,能够使文本翻译的一致性、完整性得到保证。

二、记忆辅助型长字符英语自动翻译系统具体设计

1.系统总体架构设计。实际进行系统设计,可以采用B/S架构完成系统软件开发,为记忆辅助翻译算法的实现提供支撑。采用该架构,可以利用Hadoop、Storm和MongoDB开源底层计算框架开发系统基础层和应用层,完成系统页面交互设计。在系统软件开发架构上,运用模块化设计思想,可以得到由信息管理模块、网络通信模块、程序加载模块和数据库构成的自动翻译系统。利用信息管理模块,能够实现系统数据信息的输入、输出控制管理。在网络通信模块支撑下,可以实现数据传输,为系统在线翻译功能实现提供技术支撑。凭借程序加载模块,系统能够对英语交叉编译指令程序进行加载,完成英语翻译资源调用,并通过调用系统翻译算法实现交叉编译控制,使系统完成英语自动翻译。在系统数据库设计上,需要利用寄存器完成翻译输出缓存处理,完成寄存器时钟初始化和传输位时序设定,促使加载程序能够按照网络进程完成英语翻译,实现相应寄存器的配置,继而加强系统数据内存管理。

2.系统语义特征提取。系统设计关键,在于翻译算法实现。在长字符英语翻译方面,应用翻译记忆方法实现计算机辅助翻译,需要完成英语自然语义特征分析提取,以便形成相应实例集,对长字符英语短语进行语义分割,得到语义特征相匹配的语义本体模型。在实际进行语义分割时,系统需要完成模糊映射处理。具体来讲,就是先完成语义映射约束系数设定,对翻译准确性评价集与相关邻域概念进行匹配,得到相应实词集。根据语义本体模型同义词特征,可以得到匹配集,实现模糊语义最优解计算,以便从语义上完成翻译内容正确组织。运用该种方法,其实就是根据主题词特征对英语短语内容进行相关性分析,可以根据字符匹配算子对翻译本体片段英语翻译进行可靠性预测,实现本体映射。针对从句语义,还应在确定相关性特征后完成二元语义信息特征提取,实现英语词片相关性搜索,最终输出优化语义特征。

3.系统自动翻译流程。按照系统翻译算法,在英语翻译输出结果集中,可以实现自相关特征匹配,得到字符翻译优化解向量。从流程上来看,即在前后文语义模糊概念集kal,得到(sk,ak)<(sl,al)。针对得到的翻译特征提取结果,可以完成语义主题词表的构建,然后根据配准堆栈实现系统自动翻译控制。针对长字符英语词组,还应利用二元语义特征完成关联性抽取,以获得正文文本中长字符相似度。根据词语在文本中位置,可以完成自适应上下匹配,获得模糊概念集。结合词语语境,可以利用属性字段完成翻译输出向量概念集修正,确定词长和词性关联性函数,获取词汇间互信息特征量。利用这一特征,能够完成系统翻译反馈校正。

4.系统性能仿真分析。为确定系统性能,可以利用Visual DSP++仿真平台完成系统翻译仿真实验。与传统翻译系统相比较,在英语词汇包大小达到80Gbit的情况下,系统最大能够达到96%的上下文匹配率。随着英语词汇包大小的增加,系统翻译速度逐渐下降,在词汇包大小达到600Gbit的情况下,数据召回率最大为35%。采用设计自动翻译系统,在英语词汇包大小达到80Gbit时系统最大能够达到100%的匹配率,在词汇包大小达到600Gbit时数据召回率最大为40%。由此可見,相较于传统翻译系统,设计出的自动翻译系统拥有更高翻译准确性。

三、结论

综上所述,在长字符英语翻译方面,想要提高翻译软件准确性,还要采用翻译记忆方式实现计算机辅助翻译,以便结合文本语义特征加强上下文联系,使翻译结果与上下文匹配率得到提高。实际进行自动翻译系统设计时,可以借助B/S架构实现系统翻译算法,促使系统翻译性能得到有效改善。

参考文献:

[1]张岳琢.记忆辅助型长字符英语自动翻译系统设计[J].自动化与仪器仪表,2018(10):116-118+123.