APP下载

云计算模式下的机器辅助翻译系统设计分析

2022-09-02何媛媛

电子设计工程 2022年16期
关键词:语料检索辅助

何媛媛

(榆林学院外国语学院,陕西 榆林 719000)

语言不仅是人类通信和交流的媒介,还是信息与知识传播的重要载体。在全球化经济不断发展的背景下,一个国家要想提高国际市场核心竞争力,必须要突破语言差异的难关,加强国际之间的沟通、交流和合作。而基于云计算模式下机器辅助翻译系统的出现和应用,可以帮助人们与不同语种的人进行顺畅无误地沟通和交流,为解决语言沟通障碍问题提供重要的支持平台。因此,在云计算模式的应用背景下,如何科学地设计机器辅助翻译系统是相关人员必须思考和解决的问题。

1 系统总体框架设计

在云计算模式的应用背景下,机器辅助翻译系统所含的语言资料极其丰富,这就对语言资料的统一记录提出了更高的要求。为了实现对大量语言数据进行快速、准确地翻译[1],相关人员要重视对系统分布式处理架构的设计,确保各个文件能够采用不同存储方式进行安全存储,尽可能降低系统信息交互的引用频率,从而降低系统工作复杂度,保证翻译的高效性和准确性。此外,系统针对多种语言类型设计独特的翻译方式,以满足不同语言类型的翻译需求。此外,还要针对语言的复杂性和庞大性[2],最大限度地缩短翻译时间,系统总体框架设计示意图如图1所示。

图1 系统总体框架设计示意图

2 系统硬件设计

2.1 信息存储模块设计

要想保证信息存储的稳定性、可靠性和安全性,信息存储的设计要作为重中之重。通常情况下,存储结构与分布式框架基本类似,能够实现高效地存储海量信息数据,同时,所存储的数据可以被用户多次查找和读取,通过目录数据可以实现对数据详细名称信息的统一记录和整理,便于后期用户查找和调用这些数据,便于用户根据自己的实际需求,有针对性地存储数据,为用户带来良好的体验[4]。另外,将信息存储模块与设计模板分开,通过分开存储功能的设计和使用来降低系统信息交互频率,以达到减小系统服务器吞吐数据量的目的。存储结构如图2所示。

图2 存储结构

2.2 信息检索模块设计

在云计算模式的应用背景下,用户通过机器辅助翻译系统,能够利用关键词和IPC 分类检索相结合的检索方式,快速翻译出自己需要的翻译文本[5]。其中,索引匹配方式在使用期间,若发现匹配失败,系统不会自动显示最终检索结果,此时,需要用户再次进行索引匹配,直到匹配成功为止。由于被翻译的语言类型多种多样,因此关键词的检索方式也存在很大的差异,用户要根据自己的实际检索需求,选用合适的检索方式,完成对跨域语种的科学检索[6]。信息检索模块所用到的数据库个数为三个,不仅可以调动和整理多种类型的词典信息,还能成功匹配检索结果与用户需求内容,为保证最终检索结果的准确性、真实性和完整性打下坚实的基础。此外,用户利用信息检索模块,还能在第一时间内快速获得多种数据资料,为进一步提高翻译结果的准确率创造良好的条件。

3 系统软件设计

3.1 系统分类器模型设计

系统在进行分类处理过程中,会存在不同的分类模式,所对应的特征词也存在很大的差异。如果战斗机、航空母舰等词语出现的频率较高时[7],则其文档会被自动归为“军事”类别,一旦出现这种情况,要想保证词语分类结果的准确性,需要安全、可靠地存储不同分类类别所对应的特征词。此外,还可以借助类别相关测试文件,查找出现频率较高的特征词[7],从而精确地判断和获取文件类别所对应的有效值,以达到有效补充SVM 分类结果的目的。另外,遇到需要整篇输入文本的情况时,需要借助系统对其进行处理[8],从而获得停用词文件。此时,系统会自动统计各个分类词库特征词的出现频率,为后期SVM 结果的分类提供重要的依据和参考。

3.2 系统分类功能设计

为了确保用户的使用感受,就要对用户界面进行人性化设计,相关人员要加强对系统分类功能的设计,为用户的分类操作提供最大便利。首先,通过对分类结果进行更改[9],优化分类模块,确保整个操作流程符合用户的使用需求和使用习惯。在进行分类处理的过程中,首先要利用文件目录模块点击并选中需要的语料。此时,系统会自动弹出文件夹选项窗口,当该窗口所对应的路径正确无误后,点击“确认”按钮。此外,在点击和选择语料模块或者目录的过程中,系统同样会自动弹出文件夹的选择窗口,便于选择正确的路径,最后,点击“确认”按钮。另外,为了保证训练语料处理结果的准确性和完整性[10],系统除了可以自动生成文件目录外,还能智能地生成大量的中间文件,便于用户的查找和调用[6]。用户通过使用该系统,不仅可以快速、合理地分类文件,还能将分类结果保存于结果文件中,同时,还能借助系统界面形象、直观地呈现最终的分类结果。最后,在对最终分类结果进行查看期间,点击“更改分类”按钮[11]时,系统会自动弹出分类结果的修改窗口,便于用户完成对分类结果的快速更改。系统分类流程如图3 所示。

图3 系统分类流程

3.3 系统数据库设计

要想确保机器辅助翻译系统能够可靠、稳定、安全地运行[12],需要重视对系统数据库的设计,以此确保系统能够实现对数据的高效交互和通信,同时为缩短系统翻译时间,保证翻译结果的准确性提供了重要的依据和参考。数据库包含项目信息表、文件信息表、文件段落表等大量数据表,现以项目信息表、文件信息表为例[13]进行设计,如表1、表2 所示。

表1 项目信息表

表2 文件信息表

4 系统功能设计和实现

在云计算模式的应用背景下,为了进一步提高机器辅助翻译系统的运行性能,满足人们个性化的使用需求,需要加强对系统核心功能部分的设计[14]。机器辅助翻译系统功能设计示意图如图4 所示。

图4 系统功能设计示意图

4.1 在线翻译功能设计

在线翻译功能的具体设计中,将用户需要翻译的信息放置于模块左侧,需要输出的信息放置于模块右侧,此时,用户可以根据自身的需求,合理选择所要翻译的语种。在线翻译具有较高的实时性和针对性,能够帮助用户在短时间内快速完成翻译工作。在线翻译模块主要采用了Ajax 异步刷新方式,向翻译引擎中输入相应的数据,由翻译引擎对这些数据进行翻译处理,并将最终的翻译结果输出到显示屏上,在线翻译工作过程如图5 所示。

图5 在线翻译工作过程

4.2 离线翻译功能设计

离线翻译功能在具体的设计中,需要针对已有数据文本特点,采用文本传输方式,将需要翻译的数据上传到HDFS 中,用户点击“翻译”按钮后,确定数据文本的存储位置,此时,数据会利用Reduce 进行批量处理,得出最终的结果。当最终的翻译结果显示在显示屏上后,用户可以根据自身的需求,确定是否执行下载操作。

4.3 检索功能设计

用户通过采用关键词检索法、多属性组合法或者IPC 分类检索法,对需要翻译的文本进行检索。在进行检索时,首先要将关键字与目录数据所对应的索引值进行匹配,如果匹配成功,那么检索结果会显示在右侧显示屏上,供用户查看和调用;如果匹配出现错误,那么显示屏上将不会显示最终的检索结果。检索模块如图6 所示。

图6 检索模块

5 系统测试

为了更好地验证机器辅助翻译系统的运行性能和翻译效果,对系统的核心功能进行一一测试,首先,从150 万条汉英双语语料中,随机选取100 条汉英双语语料,这些语料均来自政府、新闻等比较权威的英文文献,最终测试结果如表3、表4 所示[17]。

表3 汉英方向BLUE、NISF值测试结果1

表4 英汉方向BLUE、NISF值测试结果2

通过表中的数据可以计算得出,在云计算模式的应用背景下,该文设计的机器辅助翻译系统所获得的翻译准确率相对较高,其测试准确率达到了99.6%,因此,该系统具有非常高的可行性和有效性,不仅缩短了翻译时间,还保证了翻译结果的准确性。该系统在具体的运用中,不仅可以进行自动化处理,还能自动点击和标注原文句子,使得句子所对应的目标译文准确、无误地呈现在用户面前,极大地提升了用户的使用感受。此外,翻译来源常见渠道包含以下三种,分别是实例译文、统计译文和记忆库译文,一旦发现译文不够理想,用户可以借助该系统再次翻译,直到获得满意的译文即可。当整个翻译环节结束后,用户除了可以全面查看译文外,还能自动导出目标语言所对应的文档。

6 结束语

综上所述,机器翻译主要包含以下环节,如单词切分环节、语法规则研制环节以及词典编制环节,任何一个环节出错,都会影响最终翻译结果的准确性,为此,利用云计算模式,设计并使用机器辅助翻译系统,不仅减轻了人们学习语言的负担,还确保了翻译的准确性和高效性,为国际之间能够顺利沟通和合作提供了有力的保障。

猜你喜欢

语料检索辅助
基于归一化点向互信息的低资源平行语料过滤方法*
小议灵活构造辅助函数
倒开水辅助装置
基于大数据分析的易混淆车辅助识别系统设计与实现
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
濒危语言与汉语平行语料库动态构建技术研究
提高车辆响应的转向辅助控制系统
国内外语用学实证研究比较:语料类型与收集方法