APP下载

基于文本挖掘的能源与环境保护政策大数据研究

2021-03-11中国石油大学北京经济管理学院

财会学习 2021年7期
关键词:省份变量注意力

中国石油大学(北京)经济管理学院

引言

党的十八大以来,政府更加重视环境治理与监管,提出加强污染防治和生态建设,大力推动绿色发展,打好污染防治攻坚战。政府决策者在能源与环境保护政策方面注意力分配的概率大小促成了我国“中央政府管制型运动式治理”的环境治理路径。

一、文献综述

当前,关于能源与环境保护政策效果的研究主要集中于设计系统、可执行的有效评价方法。陈天祥和杨蕊对35年内的广东省政府工作报告进行文本分析,以词频变化、重点占比和关键词分析作为测量指标,指出“全能型”政府逐渐向“服务型”政府过渡。邓雪琳通过对中央政府工作报告高频词的计量分析,回溯性地测量了改革开放以来中国政府职能转变的特点。王印红和李萌竹探讨了地方政府生态环境治理注意力的变化规律,但并未涉及政府注意力变化对环境治理效果的影响。董纪昌等基于“十三五”以来的住房租赁政策,构建了房地产政策的PMC指数模型,量化评价了六项样本房地产政策。周海炜等基于PMC指数及其曲面图量化评价分析了我国八项大数据发展政策,并提出了合理的优化路径。

综上所述,国内外学者在政府工作报告和PMC指数模型方面已经取得大量的研究成果。然而,现有文献较少考虑以政府工作报告为文本来分析能源与环境保护政策。本文基于PMC指数模型计算各项政策的PMC指数并绘制PMC曲面图,量化评价各项能源与环境保护政策,探究政府注意力变化对能源与环境保护政策的影响。

二、能源与环境保护政策量化评价

由于政策文本数量庞大且无效信息较多,通过阅读所有政策文本并从中筛选关键词来形成有效信息,工作量巨大。因此,本文基于PMC指数模型对能源与环境保护政策进行文本挖掘及评价分析,以期为政府工作提供有效参考。

(一)政策选取

本文选取了一份中央文件和八份具有代表性的省份政策文件作为能源与环境保护政策量化评价实证研究的数据来源,具体如表1所示。

表1 九项政策组合汇总

中央政策文件在发展和环境保护政策分析中具有指导意义,另外选取的八个代表性省份是北京市、四川省、黑龙江省、山东省、山西省、上海市、湖北省、广东省。作为首都,北京市的环境保护政策更为重要,能够给其他省份做一个明确的参考。作为西电东送路线的起点,四川省拥有丰富的水能资源,其提高能源利用率的方法对其他省份具有借鉴意义。黑龙江省是我国最大油田——大庆油田的所在地,其能源转型方案尤为重要。山东省的能源消耗总量和主要污染物排放量均居全国前列,未来能源的发展方向变化是研究山东省政策文本需要关注的重点。作为西气东输路线的三个代表性省份,山西省、上海市和湖北省结合各自的经济发展状况,对能源政策的研究具有重要意义。西电东送的输入地广东省响应国家号召大力发展光伏产业,已然成为光伏产业的领先者。同时,本文选取的八个代表性省份也考虑到其所在的地理位置及经济发展状况。北京市、广东省、上海市、山东省位于东部地区,黑龙江省、山西省、湖北省位于中部地区,四川省位于西部地区。

(二)变量分类及参数识别

本文结合能源与环境保护政策的自身特点,共设置10个一级变量和45个二级变量来构建能源与环境保护政策的PMC指数模型,变量均采用二进制位数,假设45个二级变量所占的权重相同,若满足变量定义条件则记为1,不满足变量定义条件则记为0,具体如表2所示。

表2 政策变量设置

(三)计算PMC指数值

首先,基于公式(1)和公式(2),根据政策内容对二级变量进行赋值;然后,根据公式(3)分别计算一级变量;最后,根据公式(4)对一级变量加总,得到政策PMC指数。

其中,式(3)中,t为一级变量,j为二级变量,T为各项的和。

根据PMC指数,可以有效分析各项能源与环境保护政策的实施力度。同时,根据各项政策的PMC指数及政策评分等级对各项政策进行排序和分析,具体如表3所示。

表3 九项能源与环境保护政策的PMC指数及排序

(四)绘制PMC曲面

本文最初选取了10项指标,但由于所有政策文件里都具有文件引用(X10),该指标对政策评价并无影响。因此,为了矩阵的对称性,剔除X10,利用Matlab软件绘制九项能源与环境保护政策的PMC曲面图,具体如图1所示。

图1 九项能源与环境保护政策的PMC曲面图

(五)各项政策的PMC曲面评价

政策性质(X1)、政策功能(X2)、政策时效(X3)、政策评价(X4)及社会效益(X5)共同决定了政策的有效性,激励措施(X8)和保障措施(X9)可以表现政策作用手段,作用客体(X6)和政策级别(X7)则可以反映政策作用机制。根据各项代表性能源与环境保护政策的PMC指数及PMC曲面图,分别从政策有效性、政策作用手段及政策作用机制等方面对各项政策进行评价分析。

X1、X2、X3、X4及X5的平均值为0.84,说明目标省市各项政策具有良好的有效性,各省市在做到保障社会利益的同时,能够积极推进能源发展与环境保护,有效落实政策的实施与后续发展。X8和X9的平均值为0.66,说明政策的作用手段较差,强有力的作用手段能够起到鼓励及约束作用,目标省市后续政策应注意加强在政策作用手段方面的力度。X6和X7的平均值为0.71,说明政策的作用机制有待完善,扩大作用客体将有利于提高政策的作用机制。

三、政府注意力研究

(一)数据获取

本文在中国政府网站及各省人民政府网站,采集2006-2020年间国务院及31个省份(或直辖市)的政府工作报告,共获得8262511字的文本数据,以此作为数据源,分析能源与环境保护方面的政府注意力。

(二)中文分词及去停用词

本文将收集到的475份政府工作报告进行分词及去停用词处理。首先,采用jieba中文分词模型进行分词处理。其次,借鉴停用词表,将“加快、建设、推进、发展、加强以及、以上、实施、实现、期间”等指代不明的词语和虚词加入停用词表中,进而得到停用词表,完成停用词处理。

(三)主题词词频统计

TF-IDF算法可以用来衡量字词对于语料库中一份文件的重要程度。字词的重要性与其在文件中的出现次数成正比,并且与其在语料库中的出现频率成反比。TF-IDF算法的公式如下:

其中,Fjc词汇j在文本c中的出现频率,Njc是文本c中含有词汇j问题的数量,Nc文本c中所有问题的数量,K是文本c中所有词汇的数量,即经过分词及去重处理之后获得的词汇列表中的词汇数量,是分类的总数量。

基于475份政府工作报告文本数据,利用TF-IDF算法获取具有实际意义词语的TF-IDF值,并编写Python程序,通过类比相关的能源与环境保护类文本,提取政府工作报告中关于能源与环境保护的主题词,将国务院及各省份(或直辖市)处理结果排名前70的词语分别保存到TXT文档中。

本文提取了475份政府工作报告中排名前列的能源与环境保护类主题词,根据其TF-IDF值,制作了主题词词云图,具体如图2所示。

图2 政府工作报告中能源与环境保护主题词词云

由图2可知,国务院及全国各省份(或直辖市)政府对于能源与环境保护方面的注意力主要集中在煤炭领域。其中,加强企业管理以及完善产业体系是各地政府聚焦的重要举措。在推动环境保护方面,政府更加重视技术,鼓励和推动再生能源。新能源的发展已经成为国务院及各地政府一致强调的重点项目。

通过编写Python程序,利用NetworkX软件包,制作了政府工作报告中能源与环境保护类词语的语义网络,结果如图3所示。

图3 政府工作报告中能源与环境保护主题词的语义网络

由图3可知,国务院及全国各省份(或直辖市)政府对于能源与环境保护方面的注意力以能源与环境保护体系建设为中心,企业、产业为副中心向外扩张,关注领域包括天然气、电力、煤炭、新能源及再生能源等,其中,对于新兴能源(如再生能源、新能源)体系建设的重视程度要高于传统能源(如天然气、煤炭)。

结语

能源与环境保护政策的推进与落实很大程度上影响国家经济的顺利发展与人民生活的健康保障。本文以2006-2020年国务院和31个省份(或直辖市)的政府工作报告为样本,基于PMC指数模型对能源与环境保护政策进行量化评价,分析了各省市对能源与环境保护政策的政府注意力。研究结果表明:① 政府对生态环境问题的重视程度会影响环境治理效果,政府注意力水平越高,环境治理效果越好;② 各地政府在能源与环境保护方面的注意力主要集中于煤炭行业,各省市的政策激励措施均有所欠缺;③ 各地政府对能源与环境保护政策的重视程度存在差异,但整体保持在较高水平,说明政府唯GDP观念明显转变。

猜你喜欢

省份变量注意力
让注意力“飞”回来
16省份上半年GDP超万亿元
22个省
A Beautiful Way Of Looking At Things
分离变量法:常见的通性通法
不可忽视变量的离散与连续
阅读理解两则
轻松把握变量之间的关系
变中抓“不变量”等7则