基于改进TF-IDF算法的灌区水权市场运行效果评价
2022-06-25万福兵代小平
万福兵,代小平
(1.华北水利水电大学水利学院,郑州 450046;2.河海大学农业科学与工程学院,南京 210098)
0 引 言
水权交易是优化水资源配置、促进水资源节约与保护的重要途径。我国农业用水效率较低,水权交易制度作为促进农业节水的重要手段在全国广泛推行,部分地区建立了农业水权交易市场。系统、定量地评价农业水权市场的运行效果对于培育和发展水市场,促进农业节水,加深对水市场的科学认识具有重要意义。
水市场的运行效果可根据水市场产生的社会福利评估。根据古典效用主义的社会福利函数,水市场产生的社会福利为水权交易利益相关方的效用总和。成本收益分析法可用于计算水权交易利益相关方的效用[1-3],但该法未考虑利益相关者的互动关系,不能从整体上分析水市场的收益。通过构建水权交易利益相关者的效用函数或生产函数,采用最优化模型可从整体上模拟水市场的理论最大收益[4]。水市场的运行效果也可采用实验经济学方法估计[5]。此外,双重差分法(Difference in difference,DID)[6]、多阶段数据包络分析(Data envelopment analysis,DEA)模型[7]等可检验水市场对种植收益、用水效率、区域社会经济的影响。
以上研究方法可用于评价水权市场的运行效率,但不能评价水市场的综合效果。Grafton 等[8]从制度基础、公平、经济效率和环境可持续性四方面构建了较完善的水权市场运行效果评价指标体系,并对澳大利亚、智利、中国、南非和美国西部的水市场进行了定性评价。但该评价体系未区分指标的权重,不能定量评估水权市场的运行效果。薛福洋[9]采用“双赢”、“单赢”、“双输”的标准对中国典型水市场的运行效果进行比较分析,该方法操作性强,但评价结果模糊。Liu 等[10]分析了中国典型水市场的弹性,增进了对水市场运行效果的认识。万峥[11]从经济、社会和生态三方面构建了水权转换综合效益评价方法,但未分析水权转换的公平性和市场可持续性。
评价指标权重的确定方法包括主观分析法和客观分析法两类。主观分析法包括德尔菲法、层次分析法等,客观分析法包括熵权法等。前者受专家意见的影响大,后者对数据的要求高并且可能产生不符合逻辑的结果。在样本数较小的情况下,如何科学确定评价指标的权重还有待研究。
本文拟从公平、效率和可持续三方面构建农业水权市场运行效果综合定量评价指标体系,并基于改进的TF-IDF 算法提出新的指标权重确定方法。采用该评价方法对石羊河流域两个灌区的水权市场运行效果进行评价,探讨灌区水权市场运行效果在不同阶段和不同灌区间的差异,以加深对水权市场运行效果的认识。
1 研究区域和方法
1.1 研究区域
石羊河流域是中国西北干旱区三大内陆河流域之一,位于河西走廊东部,乌鞘岭以西,祁连山北麓。武威市S区A灌区和B 灌区在石羊河流域较早开展水权市场改革,积累了较丰富的水权市场运行数据,因此以这两个灌区的农业水权市场作为评价对象进行研究。2019年武威市降水量在200~300 mm 之间,年蒸发量在1 400~2 000 mm 之间[12]。A 灌区是以农业为主的大型井渠结合灌区。灌区大部分区域为渠灌区,渠道下游部分区域为井渠结合灌区。灌区有效灌溉面积2.504 万hm2。B 灌区为纯井灌区,灌区有效灌溉面积1.218 万hm2。两个灌区主要种植的作物有小麦、玉米、油菜、蔬菜等。
1.2 研究方法
1.2.1 数据来源
通过实际调查灌区管理机构和农户问卷调查相结合的方式收集数据。2019年8月,对A、B 灌区的灌溉用水户进行问卷调查。根据灌区水源情况、种植结构、水权交易等因素从两个灌区选择了17 个村,在每个村随机选择5 户农户进行问卷调查。通过问卷调查了解农户的种植结构、农业种植的投入产出、对水权交易的认知程度、参与水权交易的情况、灌溉水费和用水量等情况。
1.2.2 评价指标
基于国内外研究文献和国内水权市场运行现状,从公平、效率和可持续三方面构建农业水权市场运行效果评价指标体系,如表1所示。
表1 农业水权市场运行效果评价指标Tab.1 Evaluation index of performance of agricultural water right market
“总量控制”指标的数值越小,总量控制效果越好,和其他指标不一致。为适应评分规则,对其进行逆向化处理:
式中:X为指标得分;max=1,min取指标得分最小值。
“交易增长率”指标根据相对交易水量的平均增长速度进行计算,见式(2)为:
式中:B为平均增长速度;n为环比发展速度时期数;Bi表示第i年的平均增长速度。
1.2.3 权重确定方法
本文确定评价指标权重的思路为:将政策文件和学术文献分别看作政府和专家意见的反映,梳理两类文档中与评价指标相关的关键词,根据关键词的重要性确定指标权重。关键词的重要性采用改进的TF-IDF(Term Frequency&Inverse Document Frequency)算法计算。
TF-IDF 算法是由Salton 在1973年提出的一种统计分析方法,用于评估一个词对一个文档或对一类语料库中的部分文件的重要程度[16]。TF-IDF 算法的思路为:一个词在特定的文档中出现的频率越高,则说明其在区分该文档内容属性方面的能力越强;同时若该词在所有文档中出现的范围越广,则说明它区分文档内容的属性越低[17,18],其计算公式为:
式中:W表示某个关键词的权重,tf表示词条(关键字)在某文档中出现的频率,idf表示该关键词在所有文档中的分布情况,根据所有文档中出现该关键词的文档比例计算;i表示某一关键词在某文档中出现的次数;m指这一文档的总词数;N指所研究的总的文档数,n指包含某个关键词的文档数。
关键词的重要性和其识别文献的能力不同。作者认为一个词在特定的文档中出现的频率越高,同时若该词在所有文档中出现的范围越广,则说明其重要性越大,因此TF-IDF 算法不能直接用于计算关键词的重要性。原始的IDF计算公式未明确对数函数的底,本文将该公式中的对数函数明确为常用对数。据此对IDF 计算公式进行改进,以lg[N/(N-n)]替换lg(N/n)。修改后的公式中,IDF 计算结果与n呈正相关。当n等于N时,表明这一关键词对所有文档的重要性极强,IDF取值为1。改进的TF-IDF算法见公式(4)。
式中:W′表示某评价指标的权重;i表示某关键词在某文档中出现的次数;m指这一文档中的总关键词数;n表示出现特征项i的文档数;N表示文档总数。
本文根据相关政策文件及文献,对公平、效率和可持续三类一级指标涉及的关键词进行重要性分析,采用公式(4)计算一级指标的权重,再将该权重标准化,以基于学术文献计算的指标权重和基于政策文件计算的指标权重的平均值作为指标最终权重,见式(5)。
式中:W′i表示一级指标i的权重,1 代表公平指标,2代表效率指标,3 代表可持续性指标;W′xi表示根据学术文献确定的指标i的权重;W′zi表示根据政策文件确定的指标i的权重。
对二级评价指标,由于文献中很难找到与二级指标相关的术语,难以采用文献分析方法确定指标权重。本文假设二级指标同等重要,将一级指标权重平均分配到二级指标。
1.2.4 评分方法
结合石羊河流域灌区水权市场发展状况,将水权市场运行效果划分为优秀、良好、中等、较差4 个等级。将评分界定在0~1 之间,对其进行四等分,4 个等级分别对应四个区间:优秀,0.75~1.00 分;良好:0.50~0.74 分;中等:0.25~0.49 分;较差:0~0.24分。一级指标i的得分Ri和综合得分Z的计算公式如下:
式中:w′ij为一级指标i下二级指标j的权重;m为二级指标的数量;rij为一级指标i下二级指标j的得分。
2 研究结果
2.1 指标权重
为了解学术界对石羊河流域水权交易效果评价标准的看法,在中国知网中筛选出与石羊河水权交易最相关的18 篇文献。查找并筛选出石羊河流域自2005年以来与水权交易相关的14 个政策文件。基于CiteSpace 软件对文献内容进行分析,划分出与公平、效率、可持续性相关的词汇,构建指标指示词语分布表,如表2、3所示。
表2 学术文献词频分析 次Tab.2 Word frequency analysis of academic literatures
根据词频分析结果,采用式(4)和式(5)计算一级指标权重。指标权重计算结果见表4。其中,公平指标权重最大,可持续性指标权重最小。
表3 政策词频分析 次Tab.3 Word frequency analysis of policy documents
表4 指标权重计算结果Tab.4 Calculation result of index weights
2.2 运行效果评价
2.2.1 指标得分
根据评价指标,基于问卷调查数据和灌区统计数据,计算得到A、B灌区的评价得分,见表5。
2.2.2 公平性评价
从表5可见,被调查农户听说过水权交易的比例较高,但参与水权交易的农户较少。表明水权交易的公开程度较好,但农户参与水权交易不足。实际调查也发现,两个灌区的水权交易主要发生在行政村和村民小组层次。A灌区被调查农户听说过水权交易的比例高于B 灌区,但A 灌区农户参与水权交易的比例低于B灌区。
2.2.3 效率评价
两个灌区的多年平均水权交易价格不超过灌溉水价的40%(见表5),表明水权市场未充分反映水资源的价值。其中,A 灌区水权市场对水资源价值的反映程度更低。在2013年以后,S区的农业内水权交易实行无偿交易,农业和非农行业间的交易保持有偿交易。该政策导致A 灌区在2013年以后多数年份的水权交易价格为0,B 灌区在2013年以后有一半年份的水权交易价格为0(见图1)。A 灌区的相对水权交易价格呈现先增加后减少的趋势,B 灌区的相对水权交易价格呈波动增加趋势(图1)。
图1 A、B灌区的交易水价、灌溉水价和相对交易水价Fig.1 Water rights transaction price,irrigation water price and relative water rights transaction price of A and B irrigation district
表5 指标得分计算结果Tab.5 Calculation result of indexes
两个灌区的用水量均小于分配的水权量(表5),表明水权市场产生了总量控制效果。从两个灌区总量控制的时间变化来看(图2),A 灌区的总分配水量在2008-2012年间急剧下降,之后保持平稳,B 灌区的总分配水量基本保持平稳。A 灌区的总量控制效果逐渐变差,并且灌区在2014-2017年的用水量超过了水权量。B 灌区的总量控制效果则呈现不断增强的趋势。调查发现,B 灌区按轮次审计各村社的灌溉用水量。村社在农业水权不足时,需要购买水权后才能进行下一轮灌溉。A 灌区在水权改革后期仅在年终审计各村的总用水量,要求用水超水权的村从用水富余的村集中购买水权。水权监控方式差异可能导致了两个灌区的总量控制效果差异。
图2 A、B灌区2008-2018年用水情况Fig.2 Water consumption of A and B irrigation district from 2008 to 2018
两个灌区单位水权交易收益不足当地城市供水水价的60%(表5),表明水权交易产生的经济收益较小。其中,A 灌区的水权交易收益更低。调查发现,B灌区多种植蔬菜、水果等经济作物,A灌区主要种植粮食作物,种植结构差异是水权交易差异的主要原因。
两个灌区的多年平均水权交易量未超过分配水权量的5%(表5),表明水权市场规模很小。从两个灌区水权交易规模的时间变化可见(图3),A 灌区的水权交易量整体呈现波动增加趋势,水权交易案例数在急剧增加后急剧下降,并在较低水平上增长。B灌区的水权交易水量和交易案例数均呈现先减少后增加再减少的变化趋势。两个灌区的水权交易案例数均在2014年达到最低后增加,可能是受到无偿交易政策的影响。
图3 A、B灌区的水权交易规模(2012-2018年)Fig.3 Water rights transaction scale of A and B irrigation district(2012-2018)
2.2.4 可持续性评价
通过询问农户是否认为水权改革达到了预期目标来了解农户对水权市场的认可度。在被调查农户中,42.7%的农户认为水权改革达到了预期目标,12.4%的农户认为水权改革未达到预期目标,44.9%的农户表示“不知道”。表明部分农户不了解水权改革的情况,但在了解水权改革的农户中,对水权改革的认可度较高。
A 灌区在2013年之前的相对水权交易水量增长率为0.283,远高于2013年之后的0.042,可能是受到了无偿交易政策的影响。B 灌区相对水权交易水量的增长率为0.268。A 灌区的相对水权交易水量在急剧增加后在高位波动,但B 灌区的相对水权交易水量在急剧增加后急剧下降(见图4)。
图4 A、B灌区2008-2018年相对水权交易水量变化Fig.4 Change of relative water rights trading volume in A and B irrigation district from 2008 to 2018
2.2.5 综合评价
根据分指标得分和指标权重,计算得到两个灌区水权市场运行效果的总体得分,其中A 灌区水权市场的运行效果按2013年前和2013年后分别进行评价,结果见表6。
从表6可见,A 灌区在2013年之前的水权市场运行效果评分高于2013年之后。B 灌区水权市场的运行效果评分高于A灌区。两个灌区的水权市场运行效果均为中等等级。两个灌区的水权市场的可持续性均最高,公平性均最低,和权重计算结果一致。
表6 A灌区和B灌区水权市场运行效果综合评分Tab.6 Comprehensive score of the performance of water rights market in A and B irrigation district
2.3 灌区水权市场运行效果的时空变化
时间变化:在2013年以后,A 灌区水权市场的相对交易水价、水权市场的总量控制效果、水权市场的规模以及水权市场规模的增长率均发生了改变,并且朝低效率方向发展;B灌区的相对交易水价、水权市场规模和水权市场规模增长率也发生了改变,但总体朝高效率方向发展。表明无偿交易政策对A 灌区的影响更大。无偿交易政策直接影响水权市场的相对交易水价,可能间接影响了水权市场的规模以及规模的增长率。
空间变化:A 灌区在水权交易公开程度、交易规模上优于B灌区,但在水权交易参与程度、用水总量控制水平、水权交易收益上均低于B 灌区。A 灌区的水权交易主要发生在村级层次,而B灌区的水权交易主要发生在村民小组层次。村级层次水权交易公示的范围更广,但农户参与水权交易的难度更大,可能导致两个灌区水权交易的公开和参与程度差异。A灌区是以渠灌为主的灌区,B灌区为纯井灌区。渠灌区的灌溉用水量大,其水权交易规模也大。两个灌区的用水总量控制水平的差异受水权监控方式的影响。A 灌区主要采取年终统一审计水权,集中进行水权交易的水权监控方式,而B 灌区采取在灌溉期按轮次审计水权并进行水权交易的监控方式。水权监控方式与灌区的水源和灌溉组织方式有关。A 灌区的水源主要为地表水,地表水的可靠性低,灌溉供水由灌区统一组织,供水组织成本高。如果在灌溉期内进行水权监控,可能影响灌溉时机,并且增大灌溉组织难度。B 灌区的水源为地下水,地下水的可靠性高,灌溉供水由各村民小组负责组织,组织成本低,便于采用复杂的农业水权监控方式。两个灌区水权交易收益的差别主要受到种植结构的影响。
3 讨 论
对于石羊河流域水权交易的公开性和参与程度,王舒亚等[19]调查发现武威市只有9%的被调查用水户表示了解或比较了解水权交易市场,但本研究发现在两个灌区分别有90%和72%的被调查农户听说过水权交易,远高于王舒亚等的研究结果。随着时间的推移,农户对水权交易的认识可能更充分,但如此巨大的差异可能与调查样本有关。王舒亚等的调查样本分布在石羊河流域武威市和金昌市的17个灌区,有的灌区水权市场不发育。本文的样本集中在水权市场较成熟的两个灌区。调查样本差异可能是结果差异的主要原因。
对于水权市场的运行效率,徐梓曜等[20]发现石羊河流域水权市场的交易价格普遍偏低,浮动不大,不能体现水资源的稀缺性,与本文的发现一致。王磊[21]认为,政府对水权交易价格的干预是造成这一现象的重要原因,本文也发现水权无偿交易政策对水权市场运行效果产生重要影响。郑航等[22]发现A 灌区的水权交易主要发生在11月和12月,本文也发现A 灌区以年底集中水权交易为主。关于农户对水权改革的认可程度,王舒亚等[19]发现,在被调查用水户中,12% 的用水户认为建设水市场非常或较为可行,26%认为不可行,62%不知道是否可行或不了解水市场及其作用。本文发现,43%的被调查农户认为水权改革达到了预期目标,12%的农户认为水权改革未达到预期目标,45%的农户表示“不知道”。本文的研究结果表明农户对水权市场的看法更积极。该差异也和调查时间、调查样本分布等有关系。对比发现,虽然农户对水权市场的看法随着时间的推移有所好转,但持肯定态度的农户依然较少。
4 结 论
改进的TF-IDF 方法能根据文献分析综合政府官员和学者的经验确定指标权重,具备一定的合理性,为确定指标权重提供了新的思路。
A 灌区和B 灌区水权市场的总体运行效果评价为中等。水权市场的可持续性评价最高,公平性评价最低。
A 灌区水权市场在2013年前的运行效果评价优于2013年后,受到无偿交易政策的影响。井灌区水权市场的运行效果评价优于以渠灌为主的灌区。
两个灌区水权市场的运行效果差异来自灌区水权交易层次、水权监控方式、灌溉水源可靠性和灌溉组织方式等。
水权交易政策对水权市场的运行效果具有重要影响,水权市场的运行效果随时空变化而演变,需要在不同阶段和不同区域采取适宜的水权政策。