中英文翻译软件的开发与应用
2014-01-03杨洋
杨 洋
0 引言
移动云计算的基本思想理念源于云计算技术,虽然移动客户端结构设计各不相同,但云端服务器的海量存储能力和高速数据处理能力可以满足不同无线终端用户的服务需求。移动云计算应用服务主要是由客户端通过系统界面获得目录,再将无线终端提出的请求发送到管理系统,经过配置和检索获得正确的信息资源。基于移动云计算的应用服务需要从云端分离,当用户对页面发起访问时,系统的计算和监控功能就会立即启动,同时配合云端做出快速反应,完成相关配置以确保终端用户得到正确的信息资源。
1 移动云计算体系结构
移动云计算指的是将云计算模型应用于无线移动网络环境中形成的基本理论。本文提出的基于移动云计算的中英文在线翻译系统主要面向移动网络终端设备,其应用服务的提供与移动网络和云计算密不可分。软硬件资源利用云计算技术形成集约化网络应用,用户在移动终端上能够享受传统计算机拥有的功能。由于移动手机体积小、携带方便,其智能化发展已经获得了一定成果,但短时间内数据处理能力仍然无法与计算机相比。因此,基于移动网络可以更好地体现云计算技术的优势特点,数据处理全部在云计算服务器中完成,弱化了移动终端设备对数据处理的要求,云计算的海量数据存储能力也解决了移动手机存储容量受限的问题,同时还可以防止重要数据丢失和损坏。随着各种新型云计算网络应用的出现,云计算从传统的互联网应用已经转向为移动网络应用,移动云计算的终端设备访问方式与固定网络终端设备访问方式不同,移动云计算体系如图1 所示:
图1 移动云计算体系结构示意图
如图1 所示,移动云计算体系结构分为四个层次,分别是接受层、管理层、虚拟层和物理层。
(1)接收层:接收层也称为控制层,主要接收客户端界面、服务注册和一般服务。接收层将接收控制规则标准化,通过客户端与云端之间的合作路径来完成用户服务和注册服务。
(2)管理层:管理层位于云计算技术中服务与集群服务器之间,负责提供系统管理、服务管理功能。管理层可以为服务制定标准化操作流程,包括通知操作、确认操作和安全操作等,同时为软件程序界面提供标准化协议,将底层硬件和操作系统之间的差异隐藏,负责对全部网络信息资源进行管理,终端设备管理包括移动用户账户管理、移动环境参数配置等。
(3)虚拟层:虚拟层包括计算池、网络池和存储池等虚拟项,虚拟层具体功能由软件程序实现,例如虚拟系统、虚拟环境和虚拟平台等。
(4)物理层:物理层主要包括支持移动云计算服务的硬件设备和信息技术,可以是智能手机,也可以是非智能手机,由于手持移动终端设备不需要强大的数据处理能力和硬盘存储空间,只需要必须的功能设备,例如网络输入与输出设备、交互管理设备和计费系统等。
2 基于移动云计算的在线翻译系统设计目标
首先,为了避免出现移动终端用户手动输入大量文字带来的不便问题,在手机前端可以通过摄像头拍照的方式将需要查询的文字以图像信息记录下来,由此,无论移动终端用户是否具有中文基础,都可以将需要翻译的中文内容传送到系统提供的移动终端用户接口中。用户可以将用手机拍照的图像作为待翻译内容,还可以将图像实时存储到手机中,再按照图像内容设置目标语言和源语言,最终将在线翻译得到的结果经过OCR 提取,以文本信息的方式存储到手机中。如果移动终端用户对翻译结果比较感兴趣,可以立刻调用Google Search 进行搜索。
其次,将Google 应用服务集成于系统服务器端,调用Google Translate 应用服务实现中英文在线翻译功能。目前,Google Translate是比较权威的中英文在线翻译引擎,其功能包括字词的翻译和段落文章的翻译,用户只需要将源语言和目标语言设置明确,将需要翻译的中文源语言输入,Google Translate应用服务则可以立刻给出翻译结果。Google Translate 应用翻译采用的是统计机器翻译方式,以联合国文档作为语料库信息资源,中英文在线翻译结果准确率较高,同时支持其他语言之间的翻译功能,防止出现本地离线翻译词库过于单一的问题。
3 基于移动云计算的在线翻译系统体系结构设计
图2 基于移动云计算的在线翻译系统结构图
基于移动云计算的在线翻译系统采用的是C/S 架构模式,应用服务部署于瘦客户端。随着移动网络技术、通信技术和电子技术的发展,智能手机作为移动终端设备的代表,在数据存储能力、电池供电能力和数据处理能力方面都有了较大提升。但是,移动终端设备仍然受到自身资源的限制,因此,系统设计时采用瘦客户端模式,尽量将数据处理任务在后台服务器中完成,客户端只需要完成图像拍照、图像处理、图像发生和接收等任务,最终显示在线翻译结果。当中英文翻译任务结束之后客户端与服务器端的连接断开,直到需要再次翻译时再重新连接。由于客户端不需要始终保持与服务器端连接,更减少了客户端的资源消耗,基于移动云计算的在线翻译系统结构如图2 所示:
如图2 所示,基于移动云计算的在线翻译系统将负载过重的处理任务分配给后端服务器,包括集成Google Translate 应用服务、OCR 处理程序共同实现中英文在线翻译。同时,在线翻译系统采用OCR 引擎对收集到的图像进行识别和处理,OCR 应用属于一种计算密集型应用服务,执行OCR 应用会耗费大量系统资源。因此,本文将OCR 应用部署于后台服务器中,由于OCR 带来的性能瓶颈问题,需要配置多台OCR 引擎处理器,以及一个负载均衡器负责分发OCR 作业。由此可见,服务器端包括三个组成部分,分别是翻译处理器、OCR 处理器和负载均衡器。
移动手机客户端与无线通信网络和服务端建立网络连接,无线通信网络可以是3G 网络,也可以是Wifi 网络,在开放式Open Nebula 云平台服务端,由翻译处理器、OCR 处理器和负载均衡器共同组成一个虚拟局域网,用以实现服务端不同组件质检的数据交换功能。同时,负载均衡服务器、翻译处理服务器具有以太网接口功能,可以对应不同以太网设置一个公共网络地址。负载均衡服务器的作用是接收客户端发来的请求,翻译处理服务器的以太网络接口是用来与Google Translate 应用服务连接,并将在线翻译结果反馈,OCR 处理服务器部署的数量要根据实际访问请求的变化而改变,由此,负载均衡服务器和翻译处理服务器的配置都需要根据实际负载情况调整。
4 基于移动云计算的在线翻译系统客户端设计
图3 基于移动云计算的在线翻译系统客户端用例图
移动终端用户可以通过手机前置摄像头拍摄需要翻译的文字,以图片信息形式发送到云端服务器中,还可以从手机本地存储设备中选取图片信息发送到云端服务器,还可以在设置选项中对闪光、亮度、对焦和识别语言进行设置,再将选取的图片信息通过HTTP 协议传送到云端服务器中,再由部署在云端服务器的OCR 软件对图片信息进行识别,形成文本信息,再调用Google Translate 应用服务进行在线翻译,最后将翻译得到的目标语言反馈到移动终端手机客户端,用户可以对反馈的目标语言进行编辑,或者对感兴趣的内容在互联网上实现搜索功能。
结合系统客户端工作流程来看,基于移动云计算的在线翻译系统功能包括图片拍照、图片编辑、图片存储、文本存储、在线翻译、在线搜索和配置设置等功能。基于移动云计算的在线翻译系统客户端用例图如图3 所示:
5 基于移动云计算的在线翻译系统服务端设计
系统服务器端主要包括三个组件,分别是负载均衡服务器、翻译处理服务器和OCR 处理服务器。服务器端是整个中英文在线翻译系统的核心部分,负责接收和发送图片信息,同时利用OCR引擎实现图像识别、文字信息提取等,再调用Google Translate应用服务对提取的文字信息进行在线翻译。负载均衡服务器负责接收客户端发来的请求,按照相应原则为客户端提出的请求选择OCR 处理节点。OCR 处理服务器经过对图片信息中的识别和提取生成文本信息,将文本信息发送到翻译处理服务器中。当翻译处理服务器接收到请求后调用Google Translate 应用服务,再将在线翻译结果反馈到客户端。
当面对大量请求同时提出时,采用传统C/S 架构模式部署的服务器会由于资源配置不足等问题带来用户访问拥塞现象,导致系统数据响应时间过长,或者由于同一时间数据访问量过大而造成服务器崩溃和瘫痪,用户无法得到自己需要的响应。当用户发出的请求数量较少时,服务器又出现长时间闲置的现象,服务器利用效率过低会造成海量资源浪费。为了避免以上问题的出现,本文将后台服务器部署于基于Open Nebula 的云平台中,以此实现弹性服务、高效扩展和动态控制,对于OCR 处理服务器来说,当用户访问处于高峰时,要实现相应的动态部署扩展。
6 结论
综上所述,传统应用服务器存在管理复杂、成本过高、扩展性能低等问题,严重影响了计算密集型移动终端的应用服务性能,移动云计算技术可以对虚拟资源进行有效整合,提高网络用户的访问性能,形成动态伸缩式访问模式,确保云计算可以延伸到人们生活的各个角落,解决智能手机在应用计算密集型服务时受到资源限制和扩展性能差等问题,还可以有效解决地域限制的问题,移动终端用户可以随时与移动通信网络连接享受云计算应用服务。本文基于Android 平台,提出了基于移动云计算的在线翻译系统的设计方案,给出了系统开发模型,可以实现图片识别、图片传输、文字提取、在线翻译和在线搜索等功能。
[1] 董晓芳,曹晖,江涛.基于短语的藏汉统计机器翻译系统[J].科技风,2012,17:60-61.
[2] 周新卫,许自龙,刘浪.地址翻译技术在防火墙系统中的应用[J].科技广场,2012,10:79-81.
[3] 晋耀红.一种混合策略的专利机器翻译系统研究[J].计算机工程与应用,2012,04:29-32.
[4] 尼加提·纳吉米,席小刚,马斌,买合木提·买买提.多语种辅助翻译系统研究与实现[J]. 电脑知识与技术,2012,02:345-350.