大数据在石油石化行业统计信息系统中的设计应用
2019-04-24张熔
张熔
摘 要:近年来,随着计算机应用技术的成熟和信息系统硬件的不断进步,互联网加、云计算、大数据等概念陆续出炉,并迅速得以广泛传播,在笔者看来,这是一个循序渐进的必然发展过程,但其发展之快也着实出乎意料。“互联网加”重在数据的共享和收集,使社会的一个独立个体融入网络共享体系中,在获得网络集合资源的同时,也被网络自动集合为共享资源的一部分;如果说“互联网加”是信息资源的共享,那么“云计算”就可以说是计算资源的共享,“云计算”的推出在很大程度上突破了个体硬件计算能力的限制,使得高计算能力实现了普及化和经济性,进而推进“互联网加”的巨大信息量实现了个体性的资源整合;“大数据”是在“互联网加”和“云计算”蓬勃发展的基础上应运而生的,就是将共享资源进行归集、整合、计算、分析,并最终运用于所需领域。本文从信息统计系统的特性入手,结合大数据的理念,从功能性和实用性两个角度重点论述大数据在信息系统建设方面的作用和应用。
关键词:大数据;石油石化;信息系统
中图分类号:TP311.13 文献标识码:A 文章编号:1671-2064(2019)05-0020-02
本文笔者目前正在筹备建设石油石化行业统计信息系统,经过一段时间的研究和摸索,于系统的初始设计方面颇有些感想。笔者认为,要想将大数据的理念充分运用于統计信息系统,有必要先简单论述统计信息系统存在的一些共同特性,这些特性并不局限于某个行业,具有一定的普适性,但这也正是系统需求的基础,一切的系统开发和理念运用难免以此为基石,且简述如下:
1 可靠性
可靠性包括了真实性和全面性。对于统计数据而言,准确的说应该是相对真实性和相对全面性,由于统计数据本身并不具有严格的核对逻辑,一般也不对外进行披露和评审,从数据监管的角度也很难形成有效的强制性和约束性,而且,统计系统本身对数据的需求也具有样本性特征,所以,对统计数据要求精确性,既没有必要也不太现实,否则难免造成成本的增加,影响系统的经济性。但是,虽不要求数据精确,但数据的相对准确和全面是必要的,此为核心要求,对统计系统的结果具有重大影响。所谓数据的可靠性是指数据的收集流程和收集途径是合理且真实的,是来源于与数据应用需求直接或正向相关的应用领域,数据是可收集、可统计的,并且统计手段是真实、合理、有效的;所谓数据的真实性是数据的收集在相关性可确定的基础上并不对数据进行人为的筛选和统计干扰,虽然数据的后期整理可以排除边缘性样本的特殊性和不合理性,但并不代表在初期数据收集时即可具有倾向性的初步数据排除,原始数据的统计和收集还是应该以确保全面性为首要目标。
2 相关性
相关性即是指有用性,这就对系统设计者的业务能力和前瞻性提出了较高的要求,数据的相关性和可靠性是互相影响、相辅相成的。首先相关性是以可靠性为基础的,数据如果达不到基本的可靠性要求,更不用考虑其相关性;其次合理选取有效性的信息进行统计和抽取,在降低工作成本和提高工作效率的同时,有效降低数据不真实或者不准确的概率,间接提高数据的可靠性。对于相关性的判断是需要一个企业或者一个集团在系统设计时根据实际工作经验和历史数据特点进行合乎逻辑的职业判断,该特性的应用更多的来源于企业内部技术骨干及管理人员的顶层设计,合理的设计理念和通畅的数据收集途径是保证统计数据能够实现相关性的必要前提,而“大”和“云”对于数据的相关性而言只不过是技术手段和辅助方式而已。如果不能保证数据的相关性,那么全面的数据恐怕反而会带来令人困惑的统计结果。
3 可比性
可比性要求统计数据应当相互可比,可比性包括横向和纵向两个方面。
3.1 不同期间产生的数据可比,即纵向可比
为达到此要求,系统在抽取数据时,应保证前后期一致,即使发生了统计政策的变更,也应当按规定方法进行追溯调整,以保证数据的前后一致。当然,数据统计手段的一致性并不是说系统逻辑一旦设定,就不能进行修改或不应进行修改,恰恰相反,要想让系统数据发挥应有的功能,需要不断对系统进行完善和升级,但是在升级和修改的同时,需要注意对历史数据的调整,对于有重大影响的,考虑是否需要进行追溯既往,或者对于只影响未来数据或者逻辑变动对整体统计系统不构成重大影响的,也可以使用未来适用法。
3.2 同一期间内,不同个体之间的数据可比,即横向可比
为了达到此要求,应结合行业特点制定相对通用的取数逻辑和统计标准,避免统计数据的过分独立性,无法与其他资源进行有效的整合,无法与大数据体系相融合。
4 时效性
对于任何统计性工作来说,时效性都是一个不可忽视的指标,一旦超过了有效时限,实时数据就会变成历史数据,历史数据固然对事物规律的探求和数据模型的建立有重要的意义,但对于需要依靠现实数据进行的分析和决策辅助的意义就不是太大,因此,要想充分发挥大数据的效用,时效性必须得到某种程度的保障。
在统计信息系统具备了以上基础特性的基础上,笔者认为,对于石油行业来说,还应该在以下几个方面进行补充和强化,以更好的适用于本行业的分析和决策。
4.1 兼顾历史性
上文已经提到,数据的统计应具有可比性,其中包括纵向可比性,也就是与其他期间数据的可进行对比分析。对于石油行业来说,这项特性尤其重要,故而笔者认为,在设计该行业的统计信息系统时,更应该注意对历史数据的兼容。石油行业具有投入周期长,持续生产周期长,技术基础稳定周期长的特点,所以,石油行业的历史数据往往具备更大的可参考性,同时虽然开采技术发展迅速,勘探设备日益完善,分析理念日趋成熟,但是对于现场作业和即时决策而言,丰富的经验和深厚的阅历依然具备非常大的可借鉴价值,对历史数据的统计和对历史事件的分析依然能对现代开采决策做出较大的贡献,因此,对于如此悠久,又创造出如此多奇迹的石油行业来说,注重历史应与关注未来同等重要。
4.2 可扩展性
前文说到注重历史与关注未来同等重要,对于未来的关注就体现在系统的可扩展性上。现今而言,石油行业处于相对稳定和成熟的阶段,虽然原油价格受国际形势变动影响巨大,但单独针对石油行业的技术和决策体系来看,还是相对制度化和固定化的。同时,我们也不可不对未来进行一定的技术性前瞻,目前页岩油、新能源等技术正处于行业爆发期,一旦某项具有比较强的替代性的资源产生了创新性的变革,难免会对整个石油行业产生巨大的影响,所以,笔者认为,石油行业的统计信息系统应该重视可扩展性,简而言之,原因有二。一是从目前来看,石油行业还有很长的发展阶段,现在的数据对未来的行业发展是笔具有相当价值的财富,所以需要能适用于未来的发展变化;二是不排除重大变革的产生对石油行业造成毁灭性变革的可能性,那么在这种情况下,无论是石油行业进行转型,还是新生行业展开彻底颠覆,系统的可扩展性都是对未来的一种主动适应准备。
4.3 整体性
石油行业普遍的一个特点就是纵向一体化,每一个成熟的有竞争力的石油经济体都是巨无霸的体量,因此在该行业设计统计信息系统时应通盘考量集团性企业的整体需求,从上游到下游,从建造到科研,从开采到炼化,应从整体的角度进行顶层设计。笔者认为,对于小型企业,系统的设计应该是自下而上的,从最终需求端提出具体需求开始,这样才能更好的体现系统的实用性,但是,对于大型集团化企业来说,系统的设计应该是自上而下的,由顶层从总体需求的角度进行需求设计,一方面可以规避个体需求矛盾性的,达到集团利益最大化,另一方面可以统一基础操作单元,避免由于不同的软件体系基础造成的数据不可共享。
4.4 衔接性
石油行业从某种程度上看是一个相对简单的行业,没有繁复无常的花样与套路,无非建、采、炼、销四大板块,所以从这个角度看,石油行业的需求是固定而且明確的,所以石油行业的统计信息系统在设计时就需要确定服务的指向性,根据具体需求和希望达到的效果,将数据的统计分析与实际业务紧密的衔接起来,切不可闭门造车,单干蛮干苦干。此处大数据的应用具有一定的借鉴价值,从目前大数据的应用来看,大数据分析与软件基础建模具有互相辅助的特性,通过对大数据的应用,可以分析基础行业的需求以及达到此需求可使用的数据路径;而通过对软件模型的不断完善,可以更有针对性的抽取有价值的大数据,对软件的实用性和针对性具有重大意义。
对于石油行业而言,一方面要根据行业特点对系统记性针对性的设计,另一方面也要针对时代的发展和进步,做出合适的应对,对大数据的应用可谓是不可忽视的研究课题之一,对此,笔者认为可以从以下几个具体的层面进行统计信息系统与大数据应用的融合。
4.4.1 操作运用层
从最基层的操作层面而言,数据的集合性,信息的共享性和强大的计算性这些大数据应用所具备的最基本特征就可以满足诸多方面的具体需求,最典型的应用是在与后勤服务板块,前文已经提到,石油行业是个普遍纵向一体化的集团性企业充斥的行业,大型集团型石油企业一般都有强大的后勤供给支持团队,无论从物流配送、物料采办,还是从船舶调度、劳工调配的角度,大数据的应用都直接的做出了突出的贡献,将大数据体系结合到企业自身开发设计的统计信息系统中可以显著节约企业运营成本,提高企业配给效率,降低企业经营风险。
4.4.2 统计分析层
前文所述,历史数据对石油行业具有重要的地位,对历史数据的统计和分析可以借古塑今,扩展工作思路;对即时数据的统计和分析可以预先警示,及时发现问题。而大数据应用的特点就是数据的集合和数据的计算,在建立大数据应用统计信息系统的基础上,石油行业企业需要做的更多的是根据实际业务特点和需求设计分析模型和预警机制,从根本上为数据的实际应用性提供了可靠地支持和坚实的基础。
4.4.3 辅助决策层
石油行业的特点之一是不确定性较强,投资具有一定的风险性,而收益又往往具有集中性和爆发性的特点,所以石油行业投资从某种程度上来看是一种比较高风险、高投入、高回报的投资。针对这一行业特点,投资决策就显得格外重要,不论是勘探、开发还是生产,投资决策都是重中之重。而大数据应用的共享性和全面性可以在一定程度上作为决策制定的有效辅助手段,通过对更多元化更多层次更多角度的数据的综合运用和整体分析,可以有效的对不符合既定目标的选项进行筛选,进而提高决策的正确性和可靠性,从更根源的层面对行业的健康稳定蓬勃发展做出贡献。
综上所述,在石油石化行业设计统计信息系统需要结合石油石化行业的具体需求和业务特点,并且充分利用大数据应用理念的数据优势和计算优势,同时从多个层次多个角度综合发挥大数据应用的不同特性,从而建立通用性、扩展性、整体性和衔接性相互结合的大数据统计应用体系。