粗糙集在优化油田开发效果综合评价指标中的应用
2017-06-07张漫严胡勇翟兴然
张漫,严胡勇,翟兴然
(1.东北石油大学计算机与信息技术学院,大庆 163318;2.中国科学院重庆绿色智能技术研究院;3.中国科学院大学;4.大庆油田有限责任公司)
粗糙集在优化油田开发效果综合评价指标中的应用
张漫1,严胡勇2,3,翟兴然4
(1.东北石油大学计算机与信息技术学院,大庆 163318;2.中国科学院重庆绿色智能技术研究院;3.中国科学院大学;4.大庆油田有限责任公司)
为满足当前油田开发项目的需求,改变过去油田开发效果评价采用单一评价法的传统手段,因此有必要对油田开发效果进行综合评价。综合评价的前提是指标优选,它关系到评价结果的可信度与可靠性。以油田开发效果综合评价指标体系为研究对象,基于粗糙集理论提出了一种优化与约简的方法,对指标体系进行了优化,从而有效降低了计算量、提高了效率。通过对比实验验证了方法的有效性,为油田开发效果综合评价体系的构建提供了一种思路。
粗糙集;油田;知识约简;综合评价
对从事油田开发的工作者来说,油田开发效果是需要进行评估或评价的,其研究成果能为油田进一步的调整与决策提供依据[1]。然而,在评价过程中,评价项目往往是单项的,有的侧重于经济评价,有的侧重开发管理,有的侧重钻采工程等,并且这些评价往往在规划计划与油藏动态分析中,很少从整体出发对油田开发效果进行综合评价。
近年来,许多专家、学者致力于油田开发效果的综合评价研究。刘秀婷等[2]在建立系统、全面的指标评价体系基础上,以综合赋权法为依据,有效地将层次分析法与相似权结合起来,采用未确知的测度模型对油藏进行评价与排序,并在辽河油区特殊岩性注水油藏评价中取得了不错的效果。李斌等[3]针对油田开发项目的综合评价问题,提出了一种目标差异程度法,通过油田开发项目实例进行了计算,取得了较好的效果。刘永爱等[4]将模糊综合评价法对我国8个低渗透油田的评价指标体系进行分析与测算,从而合理地确定了油田的勘探开发顺序。李斌等[5]针对油田开发效果单一评价以及确定评价指标凭经验的不足,在进行了常规筛选方法的利弊后,建立了一种简化的聚类分析法、比重法和专家一次打分法的组合方法。经实例分析,此方法避免了评价指标因量纲不同所造成的初选指标需一致化处理,降低了计算量,提高了效率。
1 粗糙集的基本理论
粗糙集理论[6]是Pawlak提出的一种用来处理不确定、不完整信息与适应的数学工具,它可以用来解决知识提取、数据约简、规则提取与基于数据的推理等问题[7]。粗糙集最初的原型来自于比较简单的信息模型,其基本思想可以总结为两点:首先是通过关系数据库分类形成概念与规则,其次是通过对等价关系的分类和分类对目标的近似来实现知识发现[8]。
1.1 信息系统
定义1四元组S=(U,A,V,f)是一个信息系统,其中U为论域,即对象的非空有限元素集合;A为属性的非空有限集合,A=C∪D,C∩D≠Ø,C为条件属性,D为决策属性;V为值域,表示属性值的范围;f表示信息函数。
定义2对于属性子集R⊆A可以决定一个二元的不可区分关系IND(R),即:
IND(R)是对U的一个划分,其中的任意元素为等价类。
1.2 上近似与下近似
定义3为了定义知识的近似程度,这里引用两个精确集概念:上近似集与下近似集:
1.3 知识约简
信息系统中,不同属性的作用也不尽相同,有些属性是多余的。知识约简就是在保持知识库分类能力不变的前提下,删除其中不重要或不相关的知识。知识约简主要有属性值约简与属性约简两种,由于属性值约简较为简单,通常情况下的知识约简理解为属性约简。
定义4若IND(R)=IND(R-{r}),称r在R中是可以被约去的知识;若P=R-{r}是独立的,那么P为R的一个知识约简。
2 基于粗糙集的属性约简指标体系
2.1 优化问题描述
油田开发是一个开放性的、灰色的复杂巨型系统。它受很多因素影响、制约。因此,在设计综合评价系统时,需要从系统性、整体性、综合性来考虑。影响开发效果的因素有多方面,不仅有经济的、管理的、技术的,还有开发经济、开发管理、开发地质、钻采工程、油藏工程等,它们可以细分为更多低层次的因素,充分体现开发系统的开放性、动态性、层次性与系统性。这些因素都是相系影响、相互制约的,其中一些因素如图1所示。
油田开发效果综合评价指标体系是由一系列指标集合组成,这个集合可以表示为U={ui,(i=1,2…,n)},任意一个油田都是其中的一个ui。通过综合指标上的取值可以得到最终评价值D={1,2,3,4}表示其开发效果评价值从高到低。
指标集合中指标个数较多,彼此也会存在一定相似性、相关性,它们不可能都能反映油田开发效果评价,这就没必要全选为评价指标。以往的指标筛选都是凭经验来定,很少采用科学的数学方法进行筛选。因此,对指标集合进行优化是一项不可或缺的环节[9]。
对油田开发效果评价指标集合的优化,就是在保留原有指标集合分类能力不变的情况下,找到一个最小子集P,用这个子集能够代替原有指标个数过多的指标体系集合,并且这个最小子集能得出同样精度的效果。
2.2 建立信息系统
以国内10个油田2008年的开发效果综合评价数据作为实验数据,其中评价指标集C={c1,c2,…,c41} 共41个指标。指标体系的目标层为“油田开发效果综合评价指标体系”。准则层有五个方面:开发经济类、开发管理类、钻采工程类、油藏工程类与开发地质类。
图1 油田开发效果综合评价影响因素图Fig.1Factors figure of comprehensive evaluation for oilfield development effect
开发经济类下辖指标有:净现值x1、采油成本x2、百万吨产能投资x3、投资回收期x4、产出投入比x5、内部收益率x6。开发管理类下辖指标有:油水井综合时率x7、健康安全环保x8、开发管理方法与政策x9、储量替换率x10、储采比x11、月平均产量x12、累积产油量x13、井网形式x14、井网密度x15、水平井与直井井数比x16、注采比x17、自然递减率x18、综合递减率x19、含水上升率x20、最终采收率x21、地质储量采出程度x22、剩余可采储量采出程度x23。钻采工程类下辖指标有:措施有效率x24、完井方式x25、机采系统效率x26、钻井成功率x27。油藏工程类下辖指标有:地层能量保持水平x28、地质储量采油速度x29、剩余可采储量采油速度x30、剩余可采储量变化率x31、油水分布或剩余油分布x32、水驱油状况x33、储量动用程度x34、储量控制程度x35。开发地质类下辖指标有:油藏物性x36、油藏类型x37、流体性质x38、储量丰度x39、构造复杂程度x40、综合含水x41。
2.3 属性离散化与属性约简
由于所获取的数据是连续型的,而粗糙集所使用的数据是离散数据。因此需要对数据进行离散化处理[10]。离散化算法很多,有等距离、等频率的离散,NaiveScaler算法,SemiNaiveScaler算法,布尔逻辑与粗集理论相结合的离散算法等[11]。同时还考虑到这些指标间有的是定性指标、有的是定量指标,而定量指标中有的是极大型指标,有的是极小型指标,有的是区间型指标。因此,我们采用专家评分法对数据离散化,得到离散化后的决策表,以开发管理类为例,见表1。
表1 开发管理类离散化决策表Table 1The discretized decision table of development and management
得到离散化的决策表后,利用Rosetta软件[12],应用动态约简中的exhaustive calculation算法对离散决策表进行属性约简,其最小子表大小为50%,最大子表大小设为90%,获得支持数大于50%的约简,即:{x20,x22,x18,x9}={含水上升率,地质储量采出程度,自然递减率,开发管理方法与政策}。同理可以得到开发经济类的约简:{内部收益率,投资回收期};钻采工程类的约简:{钻井成功率,完井方式};油藏工程类的约简:{储量动用程度,地质储量采油速度、剩余可采储量采油速度};开发地质类的约简:{构造复杂程度,油藏类型}。综上,可得油田开发效果综合评价的优化后集合P,见图2。
图2 优化后的油田开发效果综合评价指标体系图Fig.2The optimized comprehensive evaluation index figure of oilfield development effect
2.4 实验分析
为了说明经约简方法处理后的指标是优化的指标,以开发管理类指标为例进行对比实验、分析。表2为开发管理类优化后的离散决策表。
表2 开发管理类优化后的决策表Table 2The optimized decision table of development and management
对比实验采用了六种不同的指标策略:第一种策略是未经任何约简处理的23个指标属性,即全指标策略;第二种策略是优化后的指标集合{x9,x18,x20,x22},总共4个指标;第三种策略是在优化后的指标集合里随机增加了两个指标{x7,x23},即{x7,x9,x18,x20,x22,x23},总共6个指标;第四种策略是在优化后的指标集合里随机增加了一个指标{x23},即{x9,x18,x20,x22,x23},总共5个指标;第五种策略是在优化后的指标集合里随机删除了两个指标{x20,x22},即{x9,x18},总共2个指标;第四种策略是在优化后的指标集合里随机删除了一个指标{x20},即{x9,x18,x22},总共3个指标。同时选择拉普拉斯修正的朴素贝叶斯分类器(NB)、神经网络算法(NN)两种主流分类算法,通过rapidminer软件对表2进行10折交叉验证,采样方式为线性采样。交叉验证后的结果见图3所示。
图3 不同指标策略在两种算法下的10折交叉验证精度Fig.310-fold cross-validation accuracy of different index strategies in the two algorithms
从图3中可以看出采用优化后的指标在NB算法中平均精度虽然没有全指标的高,但是优化指标所需要的指标量相比全指标策略所需指标量要少很多。而在NN算法中平均精度却明显高于其他指标策略的平均精度,相比平均精度稍差的全指标策略高出了20个百分点。可以看出优化后的指标相比其他指标最能代表开发管理类指标体系中的关键特征,这四项指标是开发管理类中的核心指标。
3 结论
油田开发效果的评价,需改变传统意义上对油田开发效果单一评价以及指标筛选凭经验的情况,而应从系统的整体性出发进行综合评价。油田开发效果综合评价体系包含了开发管理类、开发经济类、钻采工程类、油藏工程类、开发地质类等,它们的组合构成了一个综合评价系统。评价指标的确定是综合评价的前提与基础,指标选取的合理性关系到评价结果的可信度与可靠程度。通过粗糙集方法将油田开发效果综合评价指标进行了优选,使指标体系由原来的41个指标约简为13个指标,指标数量减少了68.29%,大幅度减少了后期评价与决策的工作量。同时,相比其他指标策略,具有较高的精度。粗糙集的优化、约简为油田开发效果的综合评价体系的优化提供了一种新的思路。
[1]严少权,邹俊,代鹏波.油田开发效果三大指标综述[J].管理学家,2014,613:4-7.
[2]刘秀婷,程仲平,杨纯东,等.油田开发效果综合评价方法新探[J].中外能源,2006,11(5):37-41.
[3]李斌,高正原.一种油田开发项目综合评价新方法[J].石油科技论坛,2013,32(6):35-38.
[4]刘永爱,陈伟.模糊综合评价法在低渗透油田开发决策中的应用[J].西安石油大学学报:自然科学版,2010,25 (4):45-49.
[5]李斌,毕永斌,潘欢,等.油田开发效果综合评价指标筛选的组合方法[J].石油科技论坛,2012,31(3):38-41.
[6]Pawlak Z.Rough Sets[J].International Journal of Computer &Information Sciences,1982,11(5):341-356.
[7]王学恩,韩崇昭,韩德强,等.粗糙集研究综述[J].控制工程,2013,20(1):1-8.
[8]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246.
[9]尹志红,方彬,鹿强.油田科技实力灰色综合评价[J].黑龙江八一农垦大学学报,2007,19(1):103-108.
[10]Pawlak Z,Skowron A.Rudiments of rough sets[J].Information Sciences,2007,177(1):3-27.
[11]侯利娟,王国胤.粗糙集理论中的离散化问题[J].计算机科学,2000,27(12):89-94.
[12]Shen L,Chen S.Research of customer classification based on rough set using rosetta software[C]//.GERMANY:SPRINGER-VERLAG BERLIN,2013,837-843.
Application of Aough Set to Optimize Comprehensive Evaluation Index of Oil Field Development
Zhang Man1,Yan Huyong2,3,Zhai Xingran4
(1.School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318;2.Chongqing Institute of Green and Intelligent Technology,Chinese Academy of Sciences;3.University of Chinese Academy of Sciences;4.Company Ltd.of Daqing Oil Field)
In order to meet the needs of the current oilfield development project,it is necessary to make a comprehensive evaluation of oilfield development effect by transforming the traditional method of single evaluation in the past.The prerequisite for comprehensive evaluation was the index optimization,it related to the credibility and reliability of the evaluation results.Taken the comprehensive evaluation index system of oilfield development as a research object,a method of optimization and reduction based on the rough set theory was proposed,which optimized the index system to reduce the computational effort and improve efficiency effectively.It provided a way for the construction of oilfield development effect comprehensive evaluation system according to the effectiveness of the method validated by contrast experiments.
rough sets;oilfield;knowledge reduction;comprehensive assessment
TE19
A
1002-2090(2017)03-0096-05
10.3969/j.issn.1002-2090.2017.03.022
2016-12-10
国家自然科学基金(61502094)。
张漫(1967-),女,副教授,东北石油大学毕业,现主要从事分布式并行技术、计算机网络,数据挖掘等教学与科研工作。