APP下载

石化行业:迎接大数据时代

2015-12-08陆治荣

自动化博览 2015年2期
关键词:分析

陆治荣

石化行业:迎接大数据时代

陆治荣

当前,涉及数据的行业越来越广,数据种类越来越多,数据量越来越大,使人们逐渐意识到数据蕴藏的巨大财富和商机。

陆治荣,毕业于清华大学工程数学力学系,曾在航天二院、南京炼油厂、霍尼韦尔公司高技术执行部,思华数据技术有限公司,北京石油化工工程有限公司等单位工作。近十余年,专注于数据挖掘和数据分析技术的研究、开发和应用,期间,主持了两项数据分析软件的研发,获发明专利一项,出版专著一部。

编者按:“三分技术、七分数据,得数据者得天下”,作为最新最热的技术话题,大数据受到各行业的广泛关注。而其在石化行业的应用,更是业内的热门话题。事实上,大数据在石化行业并不是什么新鲜的词汇。现如今,面对节能的挑战、新能源的发展、两化融合等多项问题,石化行业必须通过大数据的创新与应用来应对挑战,通过大数据分析,完成相关信息采集,并对数据进行存储、检索和智能分析,从数据深度关联、可视化查询、数据报告等多个方向,为石化企业实现企业决策、生产管理的智能化提供数据支持。

近年来,“大数据”一词在各种媒体上频频出现,而且越来越被人们所重视。其实,大数据问题早就存在了。

对于现代企业,采集生产和经营过程中形成的数据,分析这些数据,由此产生一系列的决策对过程进行干预和调整,这是现代工业管理所遵循的基本原则。石化行业早就重视生产经营活动中的数据采集和分析,随着计算机技术的成熟和普及,数据采集越来越密集,范围越来越广,数据越来越多。例如,乙烯生产装置需要监控的参数约5000余点,一个中等规模的石化企业需要监控的生产参数约10万点,DCS或SCADA系统的采样周期为秒级,实时数据库保存数据的周期通常为1分钟,如此算来,一个星期内,中型石化企业实时数据库累积的生产参数即可达10亿条。作为石化产业链上游的石油勘探也是如此,一个普通的油田勘探项目即可产生十几个TB的地震勘探数据,勘探公司每年的勘探数据量达1500个TB(一个TB为十的十二次方字节)。数据量之大可见一斑,由此可见,对于石化业来说,大数据问题早就有之。

大数据涉及行业广泛

随着IT技术和互联网的迅速发展,各行各业都在与各种数据打交道,就连普通百姓也在使用数据、产生数据,这些数据又被人们收集、储存和分析。例如,人们在互联网上产生数量巨大的各类数据,据统计,社交网站Facebook每天更新的信息量达5000万条,微博Twitter每天刷新的信息约6500万条,这里的数据除了传统的数字之外,还包括文本、图形、图像、声音等其它形式的数据。

当前,涉及数据的行业越来越广,数据种类越来越多,数据量越来越大,使人们逐渐意识到数据蕴藏的巨大财富和商机。2011年5月,麦肯锡全球研究院发布了题为《大数据:创新、竞争和生产力的下一个新领域》的报告。报告指出,数据已经渗透到每个行业和业务领域,逐渐成为一种重要的生产因素,人们对于大数据的运用预示着新一波生产率增长浪潮的到来。2012年3月,美国政府宣布“大数据研究和发展倡议”,并斥资启动大数据研究和发展计划。大数据上升为国家意志,大数据被认为是“未来的新石油”。

如何迎接大数据的挑战

提出大数据已有几年了,如今人们对数据的认识更加深刻,认为大数据的提出正在酝酿和促进一场工业革新,应该采取对策,制定措施,迎接大数据的挑战。2013年3月,中国电机工程学会信息化专委会发布《中国电力大数据发展白皮书》,该文件分析了电力大数据特征和大数据发展的挑战;提出了电力大数据关键技术,以及电力大数据发展策略;指出了电力大数据是电力工业技术革新的必然过程,以及重塑电力核心价值和转变电力发展方式是中国电力大数据的两条核心主线;展望了大数据的应用前景。其他行业也都在根据自身特点制定相应对策。

石化行业有重视数据的传统,例如,在企业的控制、执行和管理三个层面上分别设置数据收集、储存和处理的机制和相应设备,许多企业正在或已经建立了MES和ERP信息系统。但是,目前数据处理和应用仅仅限于统计和查询,数据中蕴含的潜在价值远远没有被挖掘出来。随着数据量的不断增长,数据的大容量储存、管理和数据安全性问题,以及随着企业在更大范围的布局而产生的分散分布与数据集成之间的矛盾等,这些问题均给我们提出了新的课题。正如麦肯锡全球研究院在其分析报告中指出的那样:大数据是一定时间内无法用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。传统的数据处理模式不能解决大数据问题,我们必须在大数据背景下重新审视对数据的认识,梳理出石化行业大数据的特点,关键技术和应对策略。

首先,我们应从两个方面来认识大数据,即:大数据既是一种新资源,又是一种新的商业模式。

如同石油、铁、煤等自然矿物一样,大数据也是一种重要资源,需要勘探、采掘、提炼等一系列步骤才能加工成有用的物质,转化成财富。对数据的统计查询只能从数据中提取一些信息,而从数据中获取更有价值的知识就需要用数据挖掘、机器学习等非传统的数据处理方法。数据、信息、知识是人们描述和认识世界的三个不同境界。数据只是记录客观事物的符号,只是一种资源;数据只有与某事物联系才能有意义,成为有用的信息;知识是描述事物的某个客观规律,反映深层次的本质属性,需要从数据中提炼。我们从大数据中要获取的不光是信息,更要获取的是知识,犹如从矿石中提炼出宝贵的金属。对于大数据的资源属性而言,除了数据分析方法之外,大数据设备同样面临许多新问题。

所谓大数据是一种新的商业模式是指:由于从大数据中发现有价值的结果,使人们突破传统的思维,产生更多的增值服务,催生新的管理模式,拓展新的业务领域,转变原有的发展方式,引发技术创新和产业革新,甚至改变传统的社会管理模式。正如牛津大学教授维克托说的那样:大数据开启了一次重大的时代转型,无论是商业、思维还是管理,都无时无刻不在受到数据的影响和改变。总之,根据大数据的特点需要改变和设计企业的管理模式。可以设想,在不久的将来企业将设置大数据分析部门,他们专门分析企业内部和周边相关的数据,从中发现问题,洞察形势,预测未来,并将这些结果分发给相关人员,及时作出相应决策。实际上,电商已经在应用大数据技术转变其销售方式,他们从互联网数据中获取客户的需求信息,根据客户需要主动将相关信息推送到客户端,做到有的放矢,提高了销售效率。

我们还应该改变传统的数据分析方法,注重应用大数据分析方法。数理统计学是传统数据分析方法的理论基础,统计分析主要包括描述性分析,相关性分析和回归分析等,数理统计基于来自对象的少数样本分析来推断总体。大数据不再是少数样本,而是对象的全体,使人们有机会俯视总体,而无需通过样本来窥视对象。对于庞大的数据体,大数据分析常常采用聚类分析、分类分析、模式分析、关联分析等分析手段,从中发现感兴趣的,重要的,或异常的模式,而不必拘泥于追求寻找变量之间精确的函数表达式。实际上,石化生产过程是复杂的物理化学变化过程,影响过程的因素多,机理十分复杂,难以用线性手段描述和精确方程表达。通过大数据分析,可以从中发现某些异常,或事故模式,对安全生产具有重大意义。大数据分析同样可以用于优化生产,以及企业管理的各个领域。与传统数据分析相比,大数据技术注重关联性分析,大数据使我们在更大的范围内,在众多的因素中研究事物之间的关联性,会发现一些有价值的新现象和新规律,而传统数据分析方法限于某个局部,造成了数据之间的断裂,数据中的规律无法充分挖掘。传统数据分析方法强调事物之间的因果关系,而大数据分析只强调业已存在的关联性,无需探究谁是因,谁是果。总之,大数据将带来全新的分析问题思路和视角。

为了迎接大数据时代的到来,石化企业应该切实做好技术改造,技术储备和技术攻关,特别在以下几个方面:数据管理上,建立大数据管理体系和架构,大数据的软、硬件平台;数据分析上,研究数据挖掘、机器学习、模式识别等新分析方法的应用;数据处理上,研究分布计算式和储存技术,云计算技术等;数据展现上,研究如何生动展示数据和数据分析结果,如可视化,三维和虚拟现实等技术;人才培养上,尽快培养解决大数据问题的技术人才。

猜你喜欢

分析
0~6岁儿童行为测听与tb-ABR的相关性分析
高层建筑加固纠偏技术分析
高层建筑结构设计分析探讨
民航甚高频通信同频复用干扰分析
隐蔽失效适航要求符合性验证分析
分析:是谁要过节
电力系统不平衡分析
电力系统及其自动化发展趋势分析
在线教育与MOOC的比较分析
徐訏 40 年代“现代志怪” 的小说叙事分析