APP下载

亿联国科:降低大数据分析应用的门槛

2012-04-17

中国计算机报 2012年12期
关键词:海量结构化数据处理

北京亿联国科数据科技有限公司(以下简称亿联国科)位于北京市海淀区上地信息产业园区。亿联国科致力于云计算环境下海量数据处理技术的研究与相关产品研发。亿联国科的大规模数据处理相关产品在国内处于领先地位,其中BigBase是我国第一款商业化的NoSQL数据库系统。此外,亿联国科还在数字出版领域进行了大量科研攻关和产品研发工作,成功地将与云计算相关的大规模数据处理技术与数字出版技术相结合,从而实现了从数字出版到云出版的过渡。

亿联国科的BigBase数据库在3月30日举行的2012第五届中国数据中心大会上被评为2012年度中国优秀大数据分析平台。BigBase是为了满足云计算时代海量数据在线分析应用的迫切需求,由亿联国科打造的中国首款拥有自主知识产权的基于NoSQL技术的商用大数据在线分析系统。BigBase是一个适用于超大规模结构化数据存储和在线分析的专业化系统。该产品针对中国传统行业的实际需求进行了大量技术创新,可以有效降低各种大数据处理应用的技术门槛,节省人力和财力,为各类企业和政府部门提供海量数据在线分析的能力。

目前,BigBase系统已成功应用于电子商务、通信、互联网、物联网等相关企业。作为一款适用于大规模结构化数据存储和在线分析的新型数据库,BigBase主要适用于三个方面的应用:一是大规模的数据库应用,当数据库中一个单表的记录大于1亿条时,必须使用类似BigBase的新型数据平台;二是高流量的应用,大量的流式数据要高速地写入到系统中; 三是应用于在线分析,要求实时获得查询结果,同时还要满足多个用户的并发查询需求。

BigBase的出现成功地解决了传统数据库遇到海量日志类数据分析时无能为力的问题。BigBase在设计上不同于传统的关系型数据库,而是属于典型的NoSQL数据库。与所有NoSQL数据库一样,BigBase主要用于对数据的高并发读写和海量数据的存储。BigBase在架构和数据模型方面进行了简化,同时增强了系统的扩展能力和并发能力。

与绝大多数NoSQL数据库不同,BigBase还拥有自己独特的优势,主要包括以下四方面:第一,具有高吞吐率,数据写入速度达到每台服务器每秒100万条记录以上,比传统关系型数据库的速度快100倍以上,数据查询时间为毫秒级;第二,可以实现服务端的计算,提供NoSQL数据所不具备的区间查询以及服务端统计计算能力;第三,具有更高的数据压缩率;第四,实现了软硬件一体化,通过专用的服务器硬件和数据压缩技术,可以更大程度地提高系统的处理性能。

BigBase已经成为海量数据在线分析的利器。目前,大数据的商业价值逐渐受到用户的肯定。传统商业智能系统中用于分析的数据,大多是企业自身信息系统所产生的标准化和结构化的运营数据,这些数据只占企业所能获取数据的不足15%。另外85%的非结构性和半结构性数据广泛存在于社交网络、物联网、移动计算、传感器和电子商务等媒介之中。企业如果能将这些新的数据与业务进行融合,那么依此做出的决策会更加准确。

电信咨询公司Ovum的最新调查显示,在北美洲、欧洲和亚太地区,半数以上的企业IT部门在不久的将来将投资于大数据分析应用。以大数据分析技术为支撑,一大批新的应用将不断产生,并推动企业业务的发展。

IT行业已进入数据为王的时代。谁拥有海量数据,并且能充分挖掘数据的价值,谁就能获得战略先机。亿联国科凭借BigBase这一利器,将助力拥有战略眼光的中国企业占领云时代的商业制高点。

猜你喜欢

海量结构化数据处理
一种傅里叶域海量数据高速谱聚类方法
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
海量快递垃圾正在“围城”——“绿色快递”势在必行
一个图形所蕴含的“海量”巧题
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
基于图模型的通用半结构化数据检索
基于软信息的结构化转换