远程翻译技术在远程视频会议系统当中的融合设计
2021-04-09暨南大学杨博文林李聪曾祥勇
暨南大学 杨博文 林李聪 曾祥勇
经过对目前跨语言交际环境下的远程视频会议系统进行分析,设计融合远程翻译技术的改造方案并对方案进行市场调查后发现,市场对跨语言交际的需求普遍存在,对远程翻译技术与远程视频会议系统融合系统的接受程度较高。在控制综合系统服务升级成本的情况下,方案通过增加服务端设计发展跨语言环境下的远程视频会议系统应用。经测算,新系统能够较好满足远程翻译应用需求。
远程视频会议系统在国际交流中的频繁应用让人们愈加意识到远程视频会议系统在跨语言交际环境当中的重要作用,感受到了远程翻译技术与远程视频会议系统进行融合设计的必要性。在当前国际间面对面交流因疫情取消的情况下,远程视频会议系统在跨语言交际环境下的使用场景也越发常见。目前,主流远程视频会议系统中均未实现远程同步翻译功能,大部分跨语言交际需要与会者自行线下安排。远程翻译的接入将有利于解决跨语言交流时翻译人才紧缺的问题。在市场调研后,我们意识到,将远程翻译与远程视频会议系统融合具有广阔的应用场景。
本设计基于远程视频会议系统用户中对跨语言交际的需求,远程翻译技术与远程视频会议系统综合应用的潜力;综合系统实现视频会议过程流畅翻译接入及更智能的后台翻译人员安排,实现一个系统智能解决远程视频会议系统所需。
1 远程视频会议系统目前应用现状及面临问题
凭借互联网科技快速发展及个人计算机小型化、全能化趋势,具有低成本、设备简单优势的软件远程视频会议系统正取代硬件远程视频会议系统成为未来远程视频会议系统主流形式。2020年的特殊环境让视频会议系统应用人群大幅拓展。目前,腾讯会议、zoom等远程视频会议系统已经借助这次用户群拓展得到了极大的发展,提升了产品稳定性和流畅性。
在远程视频会议系统快速发展同时,远程视频会议系统中功能较单一的缺点也暴露了出来。面对面会议场景中的会议记录、翻译等会议辅助需要作为普通参会者来完成相关任务,这没有充分利用远程视频会议系统的潜力。
2 市场评估与需求分析
2.1 市场调查分析
以目前使用广泛的远程视频会议系统腾讯会议为例,该系统上线于2019年12月,现已涉及超百万核的计算资源投入。受疫情影响,越来越多企业开始考虑远程办公系统。以腾讯会议为例,为应对快速扩大的远程视频会议系统市场,仅1月24日-2月6日,后台扩容10万台云主机。
基于目前远程视频会议系统快速拓展的市场,针对远程翻译与远程视频会议系统的融合设计进行市场调研。通过进行人群随机的问卷调查,共发出问卷2000份,其中有效问卷1600份。
问卷调查中人群薪资水平大多数分布在10000元左右。在被调查群体中,大部分人用远程视频会议系统的频率在一周三次以下,其中一周一次以下群体占比约为40%;每次远程会议与会人数约在20-100人;对与会者来说,这些远程会议所含内容还是非常重要的;在被问及远程会议过程中跨语言交际经历时,约20%有相关经历;关于使用远程翻译服务时可接受的付费金额,范围集中在150元/小时/译员。
从调查问卷结果来看,目前使用远程视频会议系统的人群中,大部分会议与会者人数不多,且会议内容非常重要。在被调查人群当中,有约20%的用户有过使用远程翻译服务的经历。这为融合设计产品推广提供了较良好的市场前景。同时,大部分被调查人群希望能用较低费用享受到远程会议过程中的同声传译服务。远程翻译系统的加入能有效压低翻译的人工成本,在未来产品中还可通过多种途径创造收益,进一步压低用户感知到的费用,提供更优秀的翻译服务与会议体验。
2.2 融合系统功能定位分析
经问卷调查,对融合系统的功能定位进一步明确:低成本的跨语言交际会议服务。此定位的主要服务对象,是有跨语言交际需求又对费用较敏感的小企业和个人。目前主流同声传译服务给人高价的印象,使得对费用较敏感的潜在客户选择了其他翻译方式。融合设计产品在提供翻译行业主流水平的同声传译服务同时,需尽可能压低服务成本以获取对传统同声传译服务的价格优势。目前,市场上该融合设计的竞品还未出现,所以还需要加大宣传力度,在产品中满足消费者对主流远程视频会议系统的需求从而提升满意度。
3 远程视频会议系统融合设计方案
3.1 后台内容传输流程改造
目前的远程视频会议系统,主流解决方案是采用因特网、局域网与专网的H.323/SIP标准,用移动设备或个人电脑的网络通信功能实时传输数据给后台主机,再将会议数据发送到其他与会者的客户端。
受制于较为单一的远程视频会议系统,目前主流的远程视频会议系统提供的实时功能大多基于用户端进行功能拓展,如录屏、虚拟背景等。远程视频会议系统的应用尚未充分利用云主机进行应用拓展。主机在远程视频会议系统当中更多只充当控制器的角色,未充分发挥高性能计算优势。而通过利用云主机在智能技术方面的优势,可极大程度拓展远程视频会议系统应用可能。
The relationship of specific resistivity, Hall mobility,and carrier concentration can be described as the formula:
通过在通信传输层增加一个传输路径和服务端处理相关功能,即可实现将部分服务转移到线上作为拓展功能。在不改变基础传输逻辑及标准的同时,增加服务端可接入远程翻译系统实现远程同声传译。
通过在远程视频会议系统中加入服务端口,实现远程视频会议系统智能应用拓展。
3.2 会议任务智能分配及翻译端口内嵌
将会议内容(PPT、视频等)通过通信网络传输至高性能计算机,高性能计算机利用基于深度神经网络的OCR技术对内容进行字符识别,利用CTPN实现文字区域检测、版面恢复,通过网端进行在线翻译。在翻译端最后关卡,译者在服务端处理出问题结果进行人工更正(包括未被识别部分,识别出错或翻译出错部分)。更正后的文字仍像原文档图片进行排列,段落不变、位置不变、顺序不变输出至PPT、视频、文本等画面上。
将服务端接入一台子服务器,译员集中于办公室并利用子服务器搭建局域网。会议过程中的翻译任务智能分配到译员,译员的工作小组可通过服务器的智能翻译系统进行调配,同时利用网络进行技术支持,实现计算机辅助翻译。
跨语言远程会议在进行同声传译时,需得到译员组成的同声传译小组支持。在目前主流的远程视频会议系统中较难接入同声传译。将翻译系统接入会议系统中进行融合,通过增加一路传输给客户端的音频可解决远程视频会议中的翻译问题。
客户端沟通的音视频通过系统传输到翻译系统服务器,服务器将需要翻译的内容传输给事先安排好的译员任务小组。译员在翻译过程中,输出的音频重新传回给云主机并传给客户端,客户即可在客户端上选择听原声或翻译后译员输出的音频。
4 新综合系统特点与效果
4.1 数据传输流程对比
4.2 会议任务智能分配与翻译端口内嵌效果
新的融合系统与目前主流的远程视频会议系统相比,新的融合系统最大的亮点就在于和客户端并行了一个服务端,可以在尽量不影响目前远程视频会议系统服务器性能及运行逻辑的条件下,拓展会议系统的应用可能。通过并行的翻译服务器,还可以对译员的工作进行智能化的安排。甚至在理想中的理论状态下,系统间数据传输的速度还可以更快,在专线网络等不容易受到其他用户干扰的环境当中甚至可以轻松做到数据传输的时延小于100ms。这将能够在确保会议翻译的体验不会因为译员信息由网络传输而影响的前提下,利用远程视频会议翻译系统可以减轻会议现场布置要求,译员在进行会议翻译的工作环境也由于不再受到距离制约而得到更好的保障。
5 应用拓展潜力及展望
经过融合设计之后的远程视频会议系统,在跨语言交际会议当中的会议流畅性,成本控制均有相当明显的作用。升级后的融合设计系统后台可以在目前远程视频会议系统的基础上同时接受容纳多个翻译人员在线,利用翻译人才库提升翻译劳动效率,降低企业的人工成本。与会者无需同时接入远程视频会议系统及翻译系统,即可从菜单中获取会议翻译服务。新的融合设计系统将为跨语言交际提供较低成本的流畅会议服务,助力与会者快速高效沟通互联。