大数据时代信息系统构建分析
2014-04-29王平泉逯小青
王平泉 逯小青
摘 要 大数据时代,谷歌利用人们在网上的几十亿条检索记录预测冬季流感的传播,其预测结果与官方数据的相似性高达97%,更重要的是谷歌通过分析大数据预测要比官方给出的结果早2周,显然,谷歌大数据预测更有效、更有价值。沃尔玛由其购物清单的庞大的数据库中发现飓风用品和蛋挞的相关性,在季节性风暴来临时,把蛋挞放在靠近飓风用品的位置,这一举措极大地提高了两者的销量。而这依然是得益于沃尔玛对于大数据的分析和处理。大数据带来的巨大价值正渐渐被人们认知,为人们提供了一种全新的看待世界的角度。因此,我们研究面向大数据的信息系统服务建模与活动认知。
关键词 大数据 信息系统 构建
中图分类号:TP393 文献标识码:A
互联网时代,设备互连,资源共享,UGC带来大数据。UGC是一种提倡个性化的使用互联网的新方式,它允许用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户,比如人们可以通过YouTube 网站分享一段家里萌宠的可爱视频,可以在博客上发表对于家庭生活,人际关系乃至国家大事的看法,可以在facebook上面发表时时刻刻的心情,与朋友保持互动等等。因此,除了传统的信息系统提供的数据,twitter、facebook、微博等信息社交网络应用的涌现,海量用户原创的内容带来了更大量的数据;移动互联网时代,随着移动智能设备的普遍应用,人们可以随时随地的进行信息传递和共享,用户行为进一步带来了大数据。当前,智能终端(智能手机、PAD、平板电脑、MID等)已经渗透到大众的生活当中,移动设备的普及正逐渐改变了人们的生活方式,激发出更多的移动互联网用户行为。人们更愿意让移动设备参与日常生活,运用手机上的应用和家人保持联系,动动手指就可以上网购物,这些用户行为产生的数据量将成几何性的增长;物联网时代,物理世界融入信息空间,十亿计的设备和物理环境带来的海量数据更是难以估量。物联网技术使得普通物理对象进入了信息网络,从而无限的延伸了互联网。在物联网中,数十亿的设备互通互联,产生数万亿的连接节点,物联网与云化的数据中心无缝整合在一起,产生以指数速度飞速膨胀的数十万亿GB的海量数据。在物联网中,由于更多的、混杂的以及关联度低的信息抽象为各种具有实际应用意义的用户服务,因此对信息系统的服务建模具有重要意义。
本文以物联网领域的信息系统为对象,研究信息系统服务建模与活动认知。为了建立有效的信息系统服务模型,首先分析物联网信息系统提供的服务。精准农业应用中,湿度传感器采集土壤湿度,根据湿度值进行智能的灌溉;智能楼宇应用中,温度传感器感知楼宇中的温度,系统可以根据上报的温度数据智能调整空调温度;智能交通应用中,各种传感器感知路口各个方向的车流量,智能控制相关道路的信号灯,从而有效引导对应区域的车流量。这类服务,都是根据采集到的环境量,进行分析、整合并决策,然后通过调节相应的控制器的操作来反作用于环境,从而提供智能服务,这类服务我们归结为应用服务。环境监测服务,大量环境信息,例如各种空气质量参数、图像以及视频信息上传至数据中心,便于用户随时获取;供应链管理服务,物品的详细信息以及流通中产生的大量数据存储在云服务的数据中心,用户根据每个物品的EPC(Electronic Product Code)码,则可快速查询物品的各种信息。这类服务主要为用户提供各种数据查询功能,我们称之为数据服务。本课题主要针对这两类服务展开研究。
信息系统既是大数据的重要信息来源,又是提供各种数据与应用服务的核心。大数据的数据量大、数据类型多样、价值密度低、处理速度快等特征也给构建更为合理的信息服务系统带来的多种挑战,针对两类服务—应用服务和数据服务,从模型建立、服务相关性检测、行为与活动认知、以及访问控制四个角度对大数据背景下的信息系统服务进行研究,相应的研究成果希望能够通过模型化的形式更加精确的描述信息系统中的服务,并使服务之间的冗余性、冲突性更低;对行为模式的学习与活动认知能够帮助构建更为合理的信息系统服务。各个异构信息系统之间频繁的信息交互、新兴网络的涌现对构建数据中心的访问控制战略提出了更高的要求,这迫切要求我们建立适用于海量数据的安全的动态的数据服务访问机制。由于海量数据带来繁多细粒度的服务。服务内部以及多个服务之间都会存在一定的关联性,比如服务规则的冗余性、冲突性,因此还需要对服务的相关性进行研究。进而对海量感知和操作数据的行为模式与活动进行认知和学习,从而便于生成和提供更加精准和人性化的服务。在数据建模的基础上,对数据服务上下文进行梳理与研究,提取数据和用户的可视性属性,实现更为灵活、安全、高效、扩展性强的数据服务访问。
参考文献
[1] 汪圣利.大数据时代指挥信息系统发展分析[J].现代雷达.2013(05).
[2] 杨小牛,杨志邦,赖兰剑.下一代信号情报侦察体系架构:大数据概念的应用[J].中国电子科学研究院学报.2013(01).
[3] 张春磊,杨小牛.大数据分析(BDA)及其在情报领域的应用[J].中国电子科学研究院学报,2013(01).
[4] 段松青,吴斌,于乐,王柏. PDM:基于Hadoop的并行数据分析系统[J].湖南大学学报(自然科学版),2012(10).