基于GA-BP神经网络的页岩气开发区域水资源承载力研究
2021-01-22左朝晖李绍康杨津津袁颖李翔
左朝晖,李绍康,杨津津,袁颖,李翔*
1.中国环境科学研究院 2.河北地质大学城市地质与工程学院
页岩气是蕴藏于页岩层可供开采的天然气资源,相比于常规天然气,页岩气具有开采寿命长和生产周期长的优点[1]。中国的页岩气资源可采量约为115×1011~361×1011m3,近几年页岩气年产量达到44.6×108m3,页岩气的大规模开发有助于优化我国能源消费结构[2],同时促进页岩气开发区域经济发展。然而,页岩气开采过程中需要消耗大量淡水资源[3],钻井和压裂过程所需水量通常达到10 000~24 000 m3,其中有30%~70%耗水被重复利用,其开采耗水十分严重[4-5],若不协调页岩气开发与水资源之间的关系,可能导致区域水资源匮乏[6]。因此,有必要开展页岩气水资源承载力评价研究,为页岩气开发区域水资源可持续利用政策的制定提供借鉴。
目前,国外对水资源承载力的研究很少,多数研究将水资源承载力纳入可持续发展研究范畴[7-9]。国内对区域水资源承载力的研究主要是选取社会、水资源、经济、生态4个方面的指标建立水资源承载力评价体系,运用模糊综合评价法、系统动力学法、神经网络法、生态足迹法等进行评价[10-11]。在评价指标体系方面,针对页岩气的耗水特点的区域水资源承载力研究较少,基于社会、水资源、经济、生态方面指标的区域水资源承载力评价体系缺少客观性与全面性,如何通过科学的模型分析区域页岩气开发过程中水资源承载力成为重要的研究课题。在评价方法方面,BP (back propagation)神经网络模型具有广泛的适应能力、学习能力和映射能力等特点,非线性数据处理能力十分强大,且不需要人工确定指标权重,在多变量非线性系统的建模与预测方面可取得满意的结果[12]。许莉等[13]提出了基于BP神经网络的水资源承载力综合评价方法,并描述了方法的应用过程;郭晓英等[14]将指标作为BP神经网络的输出,对厦门市的水资源承载力进行了动态分析;冯湘华等[15]使用模糊综合评判模型、TOPSIS模型、径向基神经网络模型完成了对淳化县的水资源承载力综合评价,得到神经网络与其他方法评价结果基本一致的结论;张彦等[16]在保定市水环境承载研究中将遗传算法(genetic algorithm, GA)结合BP神经网络模型形成GA-BP神经网络评价模型,并对比了BP神经网络模型和GA-BP神经网络模型的可信度,指出GA-BP神经网络模型的精度更高且具有很强的泛化能力。
笔者以威远县为研究对象,在区域水资源承载力评价中社会、水资源、经济、生态指标基础上增加页岩气开采特征指标,建立页岩气开采区域水资源承载力评价指标体系。使用GA优化BP神经网络评价模型,将GA-BP神经网络组合模型应用于页岩气开发区域的水资源承载力评价,以期为页岩气开发区域的水资源承载力评价提供思路,同时为促进威远县的社会经济活动与水资源协调发展提供参考。
1 研究方法
1.1 BP神经网络基本原理
BP神经网络是按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络[17]。BP神经网络模型一般由输入层、隐含层和输出层组成。在运算时将归一化后的指标数据作为输入层,将指标期望结果作为输出层,输入层数据正向传播至隐含层,通过传递函数处理后传播至输出层,当测试输出与期望结果之间存在误差时,将误差沿原传播过程反向传播并逐一调整各层连接权值(w1、w2)。经过不断迭代计算,当误差降至设定范围时,得到最终的神经网络模型。BP神经网络结构如图1所示。
图1 BP神经网络结构示意Fig.1 Schematic diagram of BP neural network structure
1.2 GA基本原理
GA是一种基于自然选择和遗传理论的随机优化算法,其通过选择、交叉和变异等操作对所有个体进行筛选,根据适应度保留优秀个体,淘汰适应度差的个体,循环迭代至搜寻到最优解[18]。由于其高效率的算法以及强大的全局寻优能力,被广泛应用在组合优化方面[19]。
1.3 GA-BP神经网络模型
虽然BP神经网络具有自学习和非线性映射的能力,但其算法收敛速度慢,对初始权值和阈值非常敏感,容易陷入局部最优或出现过拟合现象。遗传算法从群体出发,同时将多个个体一起比较,从而提高运算效率,同时具有全局搜索能力而不易陷入局部最优。将GA与BP神经网络结合,使用GA全局寻优的能力来优化BP神经网络模型的初始权值和阈值,可以提高BP神经网络的收敛速度,从而使优化后的网络可更好地进行预测。具体流程见图2。
图2 GA-BP神经网络流程Fig.2 GA-BP neural network flowchart
2 水资源承载力评价与分析
2.1 研究区概况
威远县位于我国西南地区,地处四川盆地中南部,行政面积1 289 km2。属亚热带暖湿季风气候,冬春干旱而夏秋多雨。地势西北高,东南低,主要为低山和丘陵地貌。由于气候与地形地貌影响,威远县降水时空分布不均,水资源开发利用率高达51%,年平均水资源总量为4.7亿m3,但人均水资源占有量仅为600 m3左右,是四川省人均水资源占有量的14,属于水资源贫乏地区。
我国已经探明的页岩气大部分分布于西南地区,目前已有9个页岩气重点建产区,威远县大部分区域处于长宁—威远国家级页岩气示范区内。长宁—威远示范区页岩气单井压裂用水量在20 000 m3以上,其中仅有20%左右的压裂用水得以循环使用,导致大部分水资源被注入地下。这使得威远县水资源情况更加复杂,进一步加剧社会、经济发展和水资源之间的矛盾。
2.2 评价指标体系及其分级标准
受经济、社会和生态的影响与制约,水资源承载力评价是一个复杂的系统,如何确定评价体系中的指标是承载力研究的基础[20]。因此,基于研究区页岩气开发与生活、生产用水的矛盾,在区域水资源承载力研究[14,21]中结合页岩气井开发规模和用水特点,确定了由5个方面共16个指标构成的区域水资源承载力指标体系,详见表1。
表 1 研究区水资源承载力评价指标体系
国内外对于水资源承载力的评价鲜见统一标准,本研究在确定分级标准时依据以下原则:1)优先采用已有国家标准或国际标准;2)尽量参照近似行业的设定标准;3)对于没有参照标准的指标,寻求专家经验或者采用等间距法、总分频率法等进行划分。依据上述原则以及GB 3838—2002《地表水环境质量标准》、GBT 50331—2002《城市居民生活用水量标准》和《页岩气发展规划(2016—2020年)》等国家标准或规划文本,将各指标对水资源承载力的影响分为5个等级,为了方便区分研究区水资源承载力状态,分别以“理想状态”“可承载”“弱承载”“弱不可承载”和“不可承载”表示,各指标对应的分级标准见表2。其中水资源承载力指数为[0.8,1.0],表明水资源承载力处于适宜人类活动的理想状态,经济社会发展不会受到水资源阻碍,可以适当加大发展力度;[0.6,0.8),表明区域水资源承载力处在可以承载人类活动的状态,经济社会发展与水资源的关系较为协调;[0.4,0.6),表明水资源承载力处在较弱的状态,社会经济发展受到水资源掣肘,需要保护水资源并进行资源分配结构优化;[0.2,0.4),表明水资源承载力处于很弱的状态,区域水资源问题较为突出,经济社会发展受到水资源阻碍,需要大力保护水资源并提高水资源供给;[0,0.2),表明水资源承载力处于差的状态,区域内社会经济发展与水资源之间极不协调。
表 2 研究区水资源承载力指标分级标准
2.3 GA-BP神经网络模型构建
基于表2的分级标准,采用随机技术公式[22]〔式(1)〕在每一等级中生成100组数据,其中随机选出90组作为训练样本数据,剩余10组作为测试样本数据。由此,在5个等级区间中共计生成500组样本,其中训练样本450组,测试样本50组。
(1)
为避免指标体系中各指标量纲不统一带来的影响,采用最大最小方法在形成模型前对数据进行归一化处理。公式如下:
(2)
式中:Xmax和Xmin为数据中最大值和最小值;Xij为数据的实际值。
选取3层神经网络模型,经过反复训练设置隐含层神经元数为6个,训练函数选用trainlm函数,模型精度设置为0.001。采用GA对所建立的网络结构进行优化,经过反复调试后确定GA参数,其中迭代次数为10,种群规模为10,交叉概率为0.3,变异概率为0.1,得到最佳适应度曲线如图3所示,最佳适应度为1.431 9。将测试样本数据代入训练好的模型,得到测试样本的拟合值和原始值的线性回归曲线(图4),相关系数为0.995 98,测试样本最大相对误差为6.50%,表明模型拟合具有良好的效果。
图3 适应度曲线Fig.3 Fitness curve
图4 测试样本回归曲线Fig.4 Test sample regression curve
将相同网络结构的BP神经网络模型和GA-BP神经网络模型的测试样本数据误差进行对比,结果见图5。由图5可知,单一BP神经网络模型的评价结果波动明显,在第40~50个样本处理过程中出现较大误差;GA-BP神经网络模型的评价结果未出现剧烈的波动,相比单一BP神经网络模型误差更小,表明该模型在页岩气开发区域的水资源承载力评价中具有一定的适用性。
图5 模型验证误差比较Fig.5 Comparison of validation errors between two models
2.4 评价结果与分析
评价指标数据来源于历年《内江市水资源公报》《内江市统计年鉴》和《威远县国民经济和社会发展统计公报》等,部分缺少数据采用插值法补全,具体数据见表3。选用训练好的BP神经网络结构,将研究区2014—2019年的评价指标数据作为输入层,将西南地区页岩气开发状态下水资源承载力作为输出层,对研究区2014—2019年水资源承载力进行评价,得到威远县页岩气开发区域的水资源承载力指数及承载力状态,结果见表4。由表4可以看出,2014—2017年水资源承载力均处于可承载状态,说明在现有页岩气开发状态下,水资源相对充足,页岩气开发处于比较适合的状态;2018年和2019年水资源承载力处于弱承载状态,说明社会经济活动和水资源处于非协调状态。从趋势上来看,2014—2019年的水资源承载力虽然没有达到不可承载的水平,但水资源承载力指数除2016年稍有回升外,均处于逐年下降趋势。
进一步分析发现,2015年人均生活用水量、万元工业增加值用水量、页岩气井群规模等均较2014年有所增加,而人均水资源量达到近几年的最低水平,其他指标变化不大,因此可以推断水资源供给不足、生活用水剧烈增加和工业用水(包括页岩气开采用水)量增加3个方面的原因导致水资源承载力剧烈波动;2016年人均水资源量达到近几年最高水平,水资源供给充足,井群规模仅增加23口,人均生活用水量相比2015年减少45 m3,万元工业增加值用水量减少,且水质达标率、植被覆盖率、年污水处理率等指标均有所增长,在这些因素的共同影响下,水资源承载力指数较2015年有所增长。由2014—2016年水资源承载力变化可以看出,其主要受到人均水资源量、人均生活用水量、万元工业增加值用水量和井群规模等指标的影响。根据页岩气井群规模、单井需水量、压裂返排液回用率和压裂液返排率4项指标数据推算研究区页岩气总需水量、回用水量和新鲜水使用量(表5),发现2017年之后虽然人均水资源量、人均生活用水量、万元工业增加值用水量等主要指标并未恶化,但页岩气井群规模急剧扩大,导致开发总需水量急剧增长,研究区水资源承载力指数下降明显,这表明页岩气系统方面的耗水压力变大是水资源承载力逐年下降的主要原因。
表3 2014—2019年评价指标数据
表4 水资源承载力评价结果
综上所述,研究区水资源承载力受到社会、水资源、生态等多方面的影响,其中主要影响因素为人均水资源量、万元工业增加值用水量和井群规模。由于页岩气开发活动不断增强,水资源承载力总体处
表5 页岩气开发所需水量数据
于下降趋势,尤其在2017—2019年开发规模快速扩大时,水资源承载力明显下降,但由于社会、水资源和生态三方面的指标均比较稳定,万元工业增加值用水量、年污水处理率、单井需水量、压裂返排液回用率等工业指标负荷逐渐降低,区域水资源承载力并未出现不可承载的情况。因此,研究区在页岩气开发时要充分考虑页岩气耗水的影响,在井群规模维持现状或继续扩大的情况下,应进一步加强水资源的节约和保护,同时调整产业结构、建设节水型社会,通过节水、回用和暂时调整经济发展重心等手段不断提高经济社会发展过程中的用水效率,保障经济社会的可持续发展。
3 结论
(1)在常规区域水资源承载力影响因素中充分考虑页岩气开发对区域水资源承载力的影响,增添页岩气开采耗水指标,建立适合页岩气开发区域的水资源承载力评价体系。采用遗传算法优化BP神经网络组合模型中的权值和阈值进行评价,与单一的BP神经网络模型相比,组合模型收敛速度更快,误差较小,评价结果更为稳定。
(2)研究区水资源承载力总体处于波动下降状态,主要受到人均水资源量、页岩气的井群规模和万元工业增加值用水量等指标影响。2014—2017年水资源承载力处于可承载水平,水资源与经济、社会、页岩气发展处于相对平衡状态,区域水资源供给仍处于较协调的状态;2018年和2019年研究区水资源承载力处于弱承载水平,页岩气开采规模急剧扩大改变了研究区的水资源承载力结构,加剧了社会经济发展与水资源之间的不平衡。
(3)研究区万元工业增加值用水量、年污水处理率、单井需水量、压裂返排液回用率等指标的持续好转可以缓解页岩气大规模开发带来的水资源压力,因此,威远县可以在节约和保护水资源的基础上,进一步降低页岩气井单井用水量,提高区域内经济社会发展过程中的用水效率,通过重新优化水资源分配结构,推动经济社会发展与水资源承载能力相适应。