APP下载

架云梯,入云端,云服务助推新闻采集效率提升——云计算在新华社新闻采集中的一种LBS应用

2012-05-30张建生韩笑陈嘉谭承欢

中国传媒科技 2012年15期
关键词:分社稿件服务器

文|张建生 韩笑 陈嘉 谭承欢

伴随GPS和无线上网技术的发展,LBS的出现让互联网再一次进化。LBS通过一组定位技术获得移动终端的位置信息(如经纬度数据),提供给移动用户本人或他人以及通信系统, 实现各种与位置相关的业务。在LBS 系统中,云计算技术能够解决巨大计算任务的问题,发挥出位置服务及时响应的重要特色,从而大大提高LBS 系统的效率, 节约计算和存储资源,为LBS 业务发展提供技术平台支持。

新闻采集是新闻“采、编、发”流程的第一环节,结合新闻稿件采集系统,“软负载均衡功能”能够实现一种在新闻采集中通过云计算提供LBS服务的实现模式,化“云”为“雨”,保障新闻信息在生产环节有效稳定流通。

当云采集遇上LBS

新华社新闻采集系统为记者提供智能客户端发稿、通用浏览器发稿、手机发稿等多终端采集手段,支持文字、图片、音频、视频等多媒体类型稿件的采集传稿功能。系统提供了能满足不同通信条件所需要的发稿方式,支持各种带宽的线路,记者可以通过ADSL、3G上网卡、电话拨号、海事卫星等通信手段向总社和国内外编辑部传稿。随着海外舆论阵地建设的加强,分社规模、发稿量和产品类型都有大幅的增加,采集系统数据量和所需处理能力也需要大幅度提高。

由于大量记者使用因特网发稿,因特网的网络联通性以及其速度就成了影响记者发稿效率的重要因素。国外分社的记者通过因特网访问位于总社的服务器,网络传输效率较低。由于国际间的网络互联问题,跨国访问对方的外网服务器的效率较低,且经常会遇到特殊的海底光缆阻断问题,导致部分分社完全无法使用互联网进行发稿,严重影响分社的发稿效率。另外,由于地域间经济发展不平衡,造成IP地址的分发与利用率不均衡,网络流量不均衡,国际间网络出口有限,而国际间互联网访问的用户量巨大,造成网络传输速度有限、效率低下。

应对上述问题,大多数的跨国公司以及大型网站都在全球多个地区设立多数据中心或多个网站镜像服务器用于解决此类问题。借鉴这些机构的做法,我们可以在全球因特网的多个骨干节点部署新闻采集的稿件接收和中转服务器,提高稿件在国家之间的互联网传输效率问题。

在海外建设采集服务的实践过程中,我们分别在欧洲、北美、亚太、亚欧地区架设了采集收稿服务器,解决当地及周边分社记者通过互联网发稿的问题。在分社部署采集外网服务器内网用户可通过宽带专线访问总社采集内网接收服务器进行发稿,这样有利于综合使用现有资源,减少投资浪费。

未来的设想是通过分布于全球各地的服务器集群建立强大的“采集云”,实现可在各种“端设备”上运行的发稿软件,按照云计算思路及“云端并重”的理念,持续创新与强化新闻采集云平台,创造更多延伸应用终端融入采集环节,提高采集系统

新一轮IT革命浪潮中风起“云”涌,云计算通过互联网或其他网络统一灵活地调用云内各种信息技术资源,实现运算资源的随时获取,按需使用,随时扩展,从而提供了高性能信息服务的实现方式。的服务能力,使新闻采集更快捷、灵活、稳定、安全。

随着海外用户数量的扩大,为提高发稿时效新建了一些海外节点。由于一些用户使用习惯难以改变,一些海外分社反映发稿速度不够理想,新建海外节点不能迅速发挥效益。这些问题可以归结为,操作者不知道如何去使用最佳的发稿服务器,甚至没有时间去了解哪个服务器是最快速的,而记者可以笼统归结为“发稿慢”问题。一个比较常见的现象是,身在柏林的记者使用了默认为“总社”的服务器进行登录发送视频稿件,由于国际间的网络互联问题,跨国访问跨洋过海的外网服务器,势必出现发稿速度慢,发稿效率低。

如何帮助用户在多节点服务器中选择最近的“一朵云”,成为的新闻采集系统在新技术下改进完善的首要问题。如图1所示。

采集云中的LBS初探:“软负载均衡功能”

在采集系统中提供LBS服务,相当于实现一种“软负载均衡”方式。

该功能涉及多个模块:IP获取(本地方式、联网方式)、IP地址解析出地区、所在地区映射和最佳服务器选择。算法流程如图2所示。

正确地点、正确信息

图1 采集云构想

图2 算法流程

该位置服务的巨大魅力在于在正确的地点把正确的服务器推荐给用户,在用户使用系统时,根据用户IP自动判定用户所在地区,根据地区不同而推荐用户访问最优的服务器,提高了系统选择网络的灵活性和可用性,从而进一步提高发稿效率。

图3 在北京本地访问eNews巴黎服务器(左:网页方式,右:客户端方式)

自动化、免打扰

实现算法并不太复杂,而算法的好处在于自动化和免打扰。在浏览器环境下,首页即可自动识别自动推荐,在客户端发稿模式中,自动代为选择最佳服务器,不管用哪种方式,操作不会比以前多。同时,通过设计减少对网络的过度依赖,一旦出现算法考虑不到或者配置文件有缺陷的时候,“采集云”不能返回正确结果,系统将按照传统方式探测现有服务器节点,保证返回结果的正确性,不会由于引入新的算法而影响记者发稿。

两种模式、统一算法

系统前端B/S、C/S两种发稿模式,使用同一个DAT数据文件解析IP信息,按照同一个XML数据文件解析最佳服务器。前端提供两种使用模式,JSP网页及C#客户端,虽然程序语言不同,但是算法一致,统一通过HTTP请求与后端进行交互获取真实IP,根据真实IP获取地区信息,解析同一种格式的地址库获得地区名称,再通过同一个配置文件,根据地区定位均衡服务器。相同的数据文件和访问方式,使两种使用模式的返回结果保持一致。由于在设计阶段就考虑了维护的工作,配合系统日志的监控分析,使后期系统维护和配置更新更加简单易行。

应用效果

该功能已成功应用于新华社全球部署的多套eNews采集系统,优化后的系统能够按预期设想一样根据用户所在地区自主选择所在区域服务器。当用户访问非本地区节点服务器时,将会看到建议更换访问节点的提示信息,效果如图3所示。

为用户推荐合适的发稿服务器带来的效果显著,特别是在海外发送视频稿件的情况,其发稿速度的提升明显。通过测试,在欧洲总分社传输大小为140M的视频文件,如果手动选择登录北京节点服务器,传输时间为76分39秒,而通过自动IP自动定位到巴黎节点的发稿服务器,稿件的传输时间仅为212秒。

同时,根据日志分析结果表明,自动均衡功能每天可以产生上百次的提醒,为这些访问者提供了更高效的发稿服务器选择。

结语

LBS应用日益广泛,其在传媒业的应用还有很大挖掘空间,本文提到的“软负载均衡功能”,相比于传统新闻采集系统,更加贴近用户潜在需求,为系统更好的升级到下一代技术体系打下了扎实的基础。而云计算与LBS的结合能够大大提高LBS的效率,而将二者应用于传媒业,使新技术新创意与新闻传统业务结合,力求给用户更好的发稿体验,让用户更惬意的漫步云端。

猜你喜欢

分社稿件服务器
录用稿件补充说明
本刊稿件体例要求
本刊稿件体例要求
本刊稿件体例要求
服务器组功能的使用
中国船级社举办第五届检验业务技能比武大赛
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
法新社进入朝鲜
计算机网络安全服务器入侵与防御